第318章宾主尽欢_超神级学霸

“你在论文里的加密原语差分密码安全性分析结果很勉强。但在现阶段意义已经不大。简单来说设计良好的密码系统，本身就具备抵御差分密码分析的能力。不过遇到更强大的超算，基于较为原始的加密原理，不需要差分密码分析也能破解。

压缩算法也是同样的道理。现有基础上的研究不可能让压缩效率有质的提升。否则专业大规模数据最有效的方式也不会是用卡车拖了。要从根本上解决问题，需要基础理论的推陈出新。但这不能怪你们，时代的局限性。”

乔泽很中肯的点评道。

“时代的局限性啊，呵呵，说得好呀。哎，我们那个时候是真没你们现在的条件，什么都靠自己摸索，不过话又说回来，小李报告上说豆豆数据库用了一种新的压缩算法，具体是怎么个情况能不能详细说说”马旭明主动开口道。

虽然说对于乔泽的评价心里多少有点不舒服，但说实话，也没太多着恼的情绪。

主动问出来，还真没什么挑衅的意思，主要是他对新的压缩算法是真的很感兴趣。外行看热闹，内行看门道。

研究过豆豆之后，马旭明也真觉得豆豆管理数据库的超高能力，跟一些新算法息息相关。

听了这话，乔泽问道：“你来之前了解过超螺旋代数中关于超复数跟超二项式这些形式的具体描述吗”

“只是超复数形式还真难不住我们，小乔啊，我跟你讲，这次我们都是有备而来，专门研究过你的乔代数几何。”一边的张明睿生怕乔泽误会了马明旭的态度，在旁边插了一句。

“哦。”乔泽点了点头，然后看了身边的苏沐橙一眼，女人立刻进屋给乔泽拿了一叠稿纸出来。

83最新地址

“那我给你举个例子，你应该就明白了，先假设一个高维向量，$\mathbf{x}=$，其中$x_i$就是数据的第$i$个特征。

然后将每个特征表示为超螺旋代数中的超复数形式$x_i=a_i+b_i\epsilon$，这里的$\epsilon$是超越单位。

现在假设我们通过pca获得了一组特征向量${\mathbf{v}_1，\mathbf{v}_2，\ldots，\mathbf{v}_k}$，这是数据的主要变化方向。

接下来就能将数据投影到pca提取的主要特征向量上，并保留前$k$个主要成分，以减少数据的维度。

压缩后的数据可以表示为$\mathbf{y}=$，其中$\mathbf{y}_i=\mathbf{x}\cdot\mathbf{v}_i$表示数据在第$i$个主成分上的投影。

同理，当需要解压缩的时候，利用压缩后的数据$\mathbf{y}$和pca提取的主要特征向量${\mathbf{v}_1，\mathbf{v}_2，\ldots，\mathbf{v}_k}$来重构原始数据。

重构的数据结构就是$\hat{\mathbf{x}}=\sum_{i=1}{k}\mathbf{y}_i\mathbf{v}_it$。”

乔泽手书的速度很快，刚刚讲解完，也完成了包含着数据表示、分析和重构三个步骤的重要公式，然后将手中的稿纸递给了对面的马明旭。

既然懂压缩，又了解过超螺旋代数，那应该就能看懂这个简单的例子。

当然这就是个最简单的理论过程，豆豆在使用的时候，还需要考虑数据预处理、参数选择等问题，以确保算法的有效性和性能。不过这些都是细枝末节的东西，在乔泽看来，只要弄懂了理论，剩下的都是小事情，无非就是要花费些时间。

甚至完全都能交给人工智能解决。

豆豆都能完美的使用这套数据库，未来升级后的人工智能就更没问题了。

超神级学霸 第318章 宾主尽欢