マイクロソフトは高速DNAデータストレージで進歩を遂げています

何千年もの間読み取り可能な合成DNAに、毎秒メガバイトのデータを書き込むことができるようになるまで、そう長くはかからないでしょう。

“href =” https://www.techrepublic.com/a/hub/i/r/2016/10/18/ 7d0cecd4-4f73-480ca089-ff312a720f1d / resize /770x / 7a98137fae338b3e65NS132CD959ab66c / dna-helix.jpg “target =” _ blank “>approximate the DNA molecule on a blue background

画像:iStockphoto / Svisio

IDCが予測する9ゼタバイトのデータストレージのすべてが2024が必要とする情報を保持します長期間保管する。 IoTセンサーの読み取り値とアプリのパフォーマンスのテレメトリは、何十年も維持するには十分に役立たない可能性があります。しかし、ビジネスと科学では、大型ハドロン衝突型加速器からの情報のストリームであろうと年金データ(英国の法律では年金制度のすべての人の生涯にわたって保持されなければならない)であろうと、アーカイブする必要のある大規模なデータセットがあります)。

見る: メタバースチートシート:知っておくべきことすべて(無料PDF)(TechRepublic)

の 2020、GitHubがデポジットされました21バチカン使徒図書館からスキャンされた原稿と一緒に北極コードボールト内のTBのデータ圧縮されたデータのQRコードをフィルムのストリップに印刷するPIQLデジタル保存システム。これは数百年後も読み取り可能です。これは、テープアーカイブの寿命よりもはるかに長く、テープアーカイブはすべて81963について書き直す必要があります。 年ですが、本当に長期保存が必要な場合は、すでに何千年もの間(DNA)情報を保存し、1立方インチに1エクサバイト以上のデータを収めることができるでしょうか。テープカートリッジでいっぱいの部屋の代わりに、それらの9ゼッタバイト(およびそれらを読み書きするための機器)はデータセンターラックに収まります。

遺伝子配列決定のためにDNAを合成、コピー、および読み取るための機器がすでにありますそして科学的研究(そして私たちはそれをする必要をやめるつもりはないので、DNAを読む技術は数百年で時代遅れになることはありません)。 「DNAを使用することで、すでに存在し、長期にわたって存在するエコシステムを利用できるようになります」と、マイクロソフトのシニアプリンシパルリサーチマネージャーであるカリンシュトラウスは述べています。ただし、追加の手順は、デジタルファイルの通常の1と0をDNAにある4つの塩基(A、C、T、G)に変換するソフトウェアと、正しい塩基配列でDNA鎖を作成するDNAシンセサイザーから始まります。 。

情報を読み取る準備ができたら、DNAシーケンサーがそのDNAチェーンの塩基配列を転写し、デコードソフトウェアがそれをバイトに戻します。

  DNAを使用したデータの読み取りと書き込みの仕組み。

“href =” https://www.techrepublic.com/a/hub/i/r/2021/12/06/06656945-3625-43de-8347-01NS81963fb55/ resize /770x / ef22246ffd4d997NS0696 e9633cd0690d / how-reading-and-writing-data- with-dna-works-credit-microsoft.jpg “target =” _ blank “>how-reading-and-writing-data-with-dna-works-credit-microsoft.jpg

DNAを使用したデータの読み取りと書き込みの仕組み。

画像:Microsodft

有用な速さでDNAにデータを書き込むことができるようにするには、DNAストレージテクノロジーは1秒あたり少なくともキロバイト、理想的にはメガバイトのデータを処理する必要があります。つまり、次の場所で複数のDNAチェーンを書き込むことができる必要があります。時間。 CPUと同様に、速度を上げ、コストを削減するための鍵は、同じスペースにより多くの機能を詰め込む並列処理です。

「4つのDNA塩基は、化学的に追加できるこれらの小さなビルディングブロックと考えることができます」とMicrosoftの上級研究員であるBichlienNguyenは述べています。 「DNA合成では、スポットの配列である表面があり、それらのスポットは、A、C、T、およびGを特定の順序で追加して、そのDNAポリマーを作成する場所です。」

ムーアの法則をDNAストレージに持ち込むhttp://www.techrepublic.com/

いくつ互いに干渉することなくパックできるDNA合成のスポットは、同時に構築できるDNAのチェーンの数を決定します(冗長性のために各チェーンの複数のコピーを作成する必要があります)。 DNA鎖に新しい塩基を入れるには、最初に塩基を追加し、次に酸を使用して鎖を次の塩基の準備をします。塩基または酸が間違った場所に入らないようにします。

以前のアプローチでは、酸の代わりに小さな鏡または光のパターン(フォトマスクと呼ばれる)を使用したり、インクジェットプリンターからのインクのように酸の小さな滴をスプレーしたりしていました。 CPUから別の教訓を得て、Microsoft Research(ワシントン大学と協力)は、それぞれが陰極に囲まれた小さなガラスの井戸に電極の配列を使用して、DNAが成長するスポットを作成し、それらを1000倍近くに詰め込みます。

「本当に重要なのは、それらのスポット間の距離、つまりピッチ、そしてそれらのスポットのサイズです」とグエン氏は語った。 「私たちは、スポットのサイズを両方とも実際に縮小しました12ミクロンから650ナノメートルそして私達はまたそれらの間のピッチを2つに縮小しましたミクロン。そして、それは私たちが異なる、ユニークなDNA鎖を成長させることができる多くの異なるスポットに詰め込むことを可能にします。ベースとまた、カソードでチェーンに追加するために適切なベースを解放します。 1つのガラスウェルから酸がこぼれると、カソードによって生成されたベースに流れ込み、別のウェルに到達できなくなります。

参照:人工知能の倫理ポリシー(TechRepublic Premium)

これは本質的に分子コントローラーおよびDNAライターですチップ上に、PCIeインターフェースを完備。マイクロソフトはこれを機能させていますが、現在は概念実証であり、一度に4本の合成DNAを構築するために使用し、会社の使命声明のバージョンを保存しています。完成したハードウェアではなく概念実証として、小さなDNA書き込みメカニズムにより、

  • のストランドが生成されます。 ベースが長い。より長いストランドはより多くのエラーを示しましたが、ハードウェアが開発されるにつれて、おそらく試薬液の供給方法をより洗練されたものにすることで、それを改善することができます。

    DNAデータストレージは、現在のストレージシステムよりも完全にエラーがない必要はありません。 DNAの複数のコピーを増やすことから始めて、複数のレベルの冗長性が組み込まれています。これは、シュトラウスが物理的な冗長性と呼んでいます。「同じ情報をエンコードする多くの分子を作成しています。」論理冗長性を使用したエラー訂正も組み込まれており、エラー訂正メモリとほぼ同じオーバーヘッドが発生すると彼女は言いました。「たとえば、同じ場所で作成されているDNAのすべてのコピーにエラーがある場合、修正できます。 “

    “この作業は、スポットを小さくすることであり、スポットを小さくするほど、コピー数は少なくなります。ただし、まだ多くのサイズになっています。 、DNAのコピーが多いので、これは問題ではありません。将来的には、DNAのコピーが数個になる可能性がありますが、この部分のサイズを縮小して維持する余地はまだかなりあると思います。最小の冗長性。 “

    概念実証ハードウェアを使用すると、書き込み速度は2KB /秒に相当します。 「これらのアレイをさらに作成することでスケールアップすることも、ピッチとサイズをさらに縮小することもできる」とグエン氏は語った。

    将来、マイクロソフトは数百万の電極スポットを制御するロジックを追加する予定だ。 、同じものを使用130このシステムの構築に使用されるnmプロセスノード。それがチップビルダーが使用していたものです20数年前、より小さく、より近代的なプロセスに移行すると、アレイは数十億の電極と1秒あたりのデータストレージのメガバイトまで拡張できるようになります;パフォーマンスとコストの両方でテープストレージに近い。

    「同じサイズのチャンクが多いほど、書き込みスループットが高くなります」とStrauss氏は付け加えました。 「それを行うには、小さなスポットを作成して同じエリアに多くのスポットを配置するか、エリアを増やします。エリアはコストに比例します。したがって、パックするほど、コストは低くなります。」 DNAピースの数が多いほど、基本的にすべてのコストを償却します。 “

    スループットは書き込み速度よりも重要です

    これまでのところ、MicrosoftはDNAデータの書き込み帯域幅を最適化しており、これがより重要な手段であると彼女は述べていますが、読み取りの待ち時間を改善する計画もあります。

    「DNAストレージは、少なくとも最初は、アーカイブストレージとクラウドでの使用に適していると考えています。書き込みの場合、電子システムで情報をバッファリングできるため、レイテンシはそれほど重要ではありません。次に、ここで行うように、バッチで書き込みます。スループットが保存している情報の量に追いつくことができる限り、書き込みにかかる時間は関係ありません。」

    DNA、レイテンシーを読み返しています情報を取得するまでの待機時間に影響します。現在のDNAシーケンス技術も、バッチでDNAを読み取ることに基づいています。 「これは待ち時間が長いが、リアルタイムのナノポアリーダーの開発が見られている」とシュトラウス氏は述べ、プロセスをスピードアップするだろう。

    マイクロソフトは、溶媒と試薬の化学にも取り組む予定だ。現在は化石ベースのDNAで使用されます。酵素への切り替え(これは、動物や植物でDNAが構築され、読み取られる方法です)は、より環境的に持続可能であり、実際にDNAチェーンを構築する化学反応もスピードアップします。 「酵素反応は、化学プロセスで現在達成できるよりもはるかに速いタイムスケールで発生します」とグエン氏は述べています。

    このような分子を制御するために電子機器を使用できることは、新薬治療のスクリーニングや病気のバイオマーカーの発見から環境汚染物質の検出まで、保管以外の多くの分野で、複数の用途があると、規模の経済を通じてコストが下がる可能性があります。

    以上のものがあります40SeagateやWestern Digitalのようなおなじみのドライブメーカーや、QuantumやSpectraLogicのようなテープの専門家を含むDNAData StorageAllianceの企業バイオサイエンス組織と一緒に。シュトラウス氏は、DNAストレージの生産システムはまだ少し離れていると警告した。 「エラー率を下げたり、システムをより自動化して統合したりするために、まだ商用システムに導入する必要のあるエンジニアリングがかなりあります。」

    しかし、マイクロソフトの調査はパブです。 ここでのリッシングは、大規模な商用DNAデータアーカイブが非常に実現可能に見えることを示しています。

    http://www.techrepublic.com/

    Microsoft Weekly Newsletter

    これらのWindowsおよびOfficeのヒント、トリック、およびチートシートを読んで、会社のMicrosoftインサイダーになりましょう。月曜日と水曜日に配信

    今日サインアップする

    も参照)

  • 量子もつれ-as-a-サービス:アンブレイカブルネットワークの「キーテクノロジー」(TechRepublic)
  • 量子10年:IBMは2020sは、クォンタムが実際の問題を解決し始めるのを見るでしょう(TechRepublic)
  • DevOps:チートシート(TechRepubl IC)
  • Ethereumチートシート:知っておくべきことすべて(無料のPDF)(TechRepublic)
  • クローン作成ツール:ツールとは何か、使用方法それら(TechRepublic Premium)
  • Tom Merrittのトップ5シリーズ(TechRepublic on Flipboard)
  • Related Articles

    Back to top button