身为法师的我只想追求真理最新章节_身为法师的我只想追求真理乌鸦一号全文免费阅读

关灯

护眼

字体：

大

中

小

第一百五十二章怀疑人生(3/4)

存书签

书架管理

返回目录

    阅读提示：为防止内容获取不全，请勿使用浏览器阅读模式。

理论基础直接去网址里下载。”

    “梅林好像知道我们想干嘛一样。”

    其他研究员知道后，议论纷纷：

    “网址下载？这更像论坛了。”

    “不愧是老式BBS的风格，以前的BBS论坛下载就是这样，直接放网址链接。”

    “梅林一定是蓝星人，这些细微的习惯跟蓝星人太像了，而且一定是在BBS论坛盛行前出生的。”

    ......

    “DNA作为天然遗传信息的载体，提供了一种稳定、高效且可持续的数据存储解决方案。”

    “自从蓝星上的生命一开始，大自然就以自己的方式解决了如何把信息遗传给下一代的问题：

    它以四个碱基（A、T、C、G）的独特顺序存储定义有机体的信息，这些碱基位于微小的称为脱氧核糖核酸(DNA)的分子，这种存储信息的方式已经持续了30亿年。

    DNA分子作为信息载体，与传统的存储介质相比具有许多优势。

    其高存储密度、潜在的低维护成本等优良特性使其成为信息存储的理想替代品”

    “介质存储信息的能力我们用香农信息指数来衡量，由于DNA分子是由脱氧核糖核苷酸单体的线性链组成的异质聚合物。

    每个单体采用四种碱基A、T、C和G中的一种，特定排列（即序列）提供了一定量的信息。

    根据香农信息的定义，单个碱基所能容纳的最大自我信息量（H）为......

    自我信息对碱基分布的依赖性在表1中给出，其中a是“概率分布偏差”，即碱基出现的频率与0.25的平均频率之间的差异。”

    “对于DNA分子来说，如果四个碱基中的每一个都与自身完全对应，那么H(X|Y)=0，I(X;Y)=2t/碱基，传输中的平均互信息等于源熵，它给出了传输信息量的上限。

    但是，在写入和读取DNA序列的过程中，信息可能会发生扭曲，导致输入集X和输出集Y不匹配，从而降低了传输过程中的平均互信息。例如，如果每个碱基对应于除自身以外的其他三个碱基的概率为1/10。

    碱基读数的失真大大降低了DNA中信息传输的效用。

    不同传输错误率下的平均交互信息（一个碱基被错误地读出为其他三个碱基之一的概率），假设2位/碱基输入。平均互信息随输入基础偏差和传输错误率存在一定的关联性。

    我们可以通过某种手段来规避这种错误，完美的发挥DNA分子应有的存储效率。”

    “在DNA中增加存储数据的纠错码。通过存储模型，其中数据集由一组无序的M序列表示，每个序列的长度为L。该模型中的错误是整个序列的丢失和序列内的点错误，例如插入、删除和替换。

    我们在此存储模型中推导出纠错码的可实现基数的Gilbert-Varshav下界和球体上界。

    进一步提出了明确的代码结构，以纠正这种可以有效编码和解码的存储系统中的错误。”

    （上面写的很简单，这是根据《NationaleRevie》2020年第7卷的某一期里面关于DNA存储技术的一篇综述改编的，主要做了简化处理。）

    生物存储技术的本质其实就是利用DNA存在四类不同碱基的特性，利用这根链条来存储信息。

    蓝星自主研发的实验室产物，听上去很美好，但是有很多的问题。

    其中最大的问题在于信息的读取和写入，读取还好一点，信息写入DNA分子里相当复杂，这种设备又贵又不好用，普通人你让他往DNA分子里写信息，至少得培训几个月吧。

    别人用个DNA存储还得培训几个月，那我不如用硬盘。

    梅林给的生物存储技术是可
本章未完，请点击下一页继续阅读》》