DNAデータストレージとは何か、AI時代に注目される次世代保存技術
DNAが次世代データストレージになる日
半導体・AIデータセンターの裏側で進む「保存革命」
コンピューターは0と1で情報を保存し、生命はA・C・G・Tで情報を保存します。
この二つの仕組みをつなげる技術が、DNAデータストレージです。
コンピューターの言語は2進法です。 写真、動画、文章、音声、AI学習データまで、すべてのデジタル情報は最終的に0と1の組み合わせとして保存されます。 HDD、SSD、クラウド、データセンターは、この0と1を大量に記録し、必要なときに読み出すための仕組みです。
一方、生命の情報保存システムはDNAです。 DNAはアデニン(A)、シトシン(C)、グアニン(G)、チミン(T)という4種類の塩基で構成されています。 つまり、コンピューターが0と1の2種類で情報を表すなら、DNAはA・C・G・Tという4種類の文字で生命情報を記録しているとも言えます。
ここで生まれる発想が、コンピューターのデータをDNAの塩基配列に変換して保存するというものです。 これはSFのように聞こえますが、すでに研究段階では実証が進んでおり、Microsoft、University of Washington、Twist Bioscience、Atlas Data Storageなどがこの分野に関わっています。 ただし、すぐにSSDやHDDを置き換える技術ではありません。 本質は、超長期保存が必要なコールドデータの市場を変える可能性にあります。
1. DNAデータストレージとは何か? 🧬
DNAデータストレージは、デジタルデータをDNAの塩基配列に変換して保存する技術です。 たとえば、コンピューター上のデータは0と1で構成されています。 これを2ビットずつ区切り、00をA、01をC、10をG、11をTのように対応させれば、0と1の列をDNAの文字列に変換できます。
たとえば、あるデータが変換されてC-A-T-Gのような配列になったとします。 その配列をもとに人工DNAを合成すれば、デジタルデータが物理的なDNA分子として保存されます。 必要なときはDNAシーケンサーで塩基配列を読み取り、再び0と1に戻すことで、元の写真、文章、動画、ファイルとして復元できます。
DNAデータストレージは、ハードディスクに磁気でデータを刻む代わりに、 DNAのA・C・G・Tという文字列にデータを変換して保存する技術です。 コンピューターの0と1を、生命の文字である4種類の塩基に置き換える仕組みです。
保存されたDNAは、光や水分を避けたカプセルや容器の中で保管できます。 電源をつなぎ続ける必要がなく、冷却装置を常時動かす必要もありません。 ここが、巨大データセンターや磁気テープ保管庫と大きく違う点です。
2. なぜDNAは圧倒的な保存密度を持つのか? 📦
DNAストレージの最大の魅力は、保存密度です。 研究では、理論上DNA 1gに約215PBのデータを保存できるという試算が示されています。 1PBは1,000TB、つまり1,000,000GBです。 これは現在のHDDやSSD、磁気テープと比べても桁違いの密度です。
なぜそこまで密度が高いのでしょうか。 理由は、DNAが分子レベルで情報を保存するからです。 HDDやSSDは物理的な部品や回路の中に情報を記録しますが、DNAは極めて小さな分子構造そのものに情報を埋め込みます。 そのため、同じ体積の中に非常に多くの情報を詰め込めます。
1PBは1,000TBです。 もしDNA 1gに約215PBを保存できるなら、数千PB級のデータでも、理論上はごく小さな量のDNAに収められる計算になります。 ただし、これは研究上の理論値・実験値をもとにした話であり、商用システム全体では容器、読み書き装置、エラー訂正などの追加構造が必要です。
この密度の高さが注目される背景には、AI時代のデータ爆発があります。 生成AIは巨大な学習データ、モデルの重み、ログ、動画、画像、センサー情報を大量に必要とします。 AIデータセンターが拡大するほど、計算用GPUだけでなく、データをどこにどう保管するかという問題も大きくなります。
3. AIデータセンター時代になぜ保存技術が問題になるのか? 🏭
AI競争は、GPUの数を増やす競争だけではありません。 大規模モデルを訓練するには、電力、冷却、ネットワーク、建物、ストレージ、運用人員がすべて必要です。 その象徴的な事例が、xAIの巨大AIスーパーコンピューターColossusです。
xAIはテネシー州メンフィスでColossusを構築し、100,000基規模のNVIDIA H100 GPUクラスターを短期間で稼働させたと説明しています。 その後、200,000基規模へ拡張する計画も示されました。 これはAIインフラがどれほど巨大化しているかを示す代表的な例です。
ただし、こうしたAIデータセンターはGPUだけで成立しません。 学習データ、モデルチェックポイント、ログ、動画、画像、バックアップデータを保存するためのストレージが必要です。 さらにデータセンターは電力を大量に使い、冷却にも大きなコストがかかります。 そのため、長期保存データをより小さく、より低電力で保管する技術への関心が高まっています。
AI時代のデータ問題は、単に「計算が足りない」だけではありません。 計算した結果、学習に使ったデータ、監査用ログ、映像アーカイブ、医療・金融データを長期間どう保存するかも大きな課題です。 DNAストレージは、この長期保存領域で注目されています。
4. DNAストレージの強みは電力と寿命にある 🔋
DNAストレージのもう一つの大きな強みは、保管中の消費電力が極めて小さいことです。 HDDやSSD、データセンターのストレージは、運用のために電力、冷却、保守が必要です。 しかしDNAは、適切に乾燥・遮光・密封して保管すれば、電源を接続し続ける必要がありません。
これは長期保存において大きな意味を持ちます。 データセンターでは、保存しているだけのデータでも電力、空調、交換、バックアップ、移行作業が必要になります。 一方、DNAに変換されたデータは、読み出すまでは基本的に保管されるだけです。 この性質は、アクセス頻度の低いアーカイブ用途と相性が良いと考えられます。
寿命の面でもDNAは注目されています。 HDDやSSDは部品劣化、磁気劣化、電子部品の寿命、コントローラー故障などのリスクがあります。 磁気テープも定期的な移行や管理が必要です。 しかしDNAは、古代生物の化石からも遺伝情報が読み取られるように、条件が良ければ非常に長期間保存できる可能性があります。
HDDやSSDは「頻繁に使うデータ」を高速に読み書きするための装置です。 DNAストレージは「ほとんど使わないが、長期間失ってはいけないデータ」を保管するための技術です。 つまり、競争する市場が完全に同じではありません。
5. Microsoftや研究機関はどこまで実証しているのか? 🔬
DNAデータストレージは、すでに複数の研究機関と企業によって実証が進んでいます。 MicrosoftとUniversity of Washingtonは、人工DNAにデータを保存し、読み出す研究を進めてきました。 2019年には、DNAへの保存と読み出しを自動化するシステムの実証も発表されています。
また、DNA Fountainと呼ばれる手法では、DNAにデータを高密度で保存する研究が行われ、1gあたり215PBという保存密度の試算が知られるようになりました。 これはDNAストレージが理論上どれほど高密度になり得るかを示す重要な成果です。
さらに、Catalogのようなスタートアップは、英語版WikipediaのテキストデータをDNAに保存する実験で注目されました。 こうした事例は、DNAストレージが単なる概念ではなく、少なくとも実験・実証段階では機能していることを示しています。
実証できたことと、商用ストレージとして安く大量に使えることは別問題です。 DNAストレージには、合成コスト、読み出し速度、エラー訂正、検索性、標準化、運用システム化という課題が残っています。
6. なぜ今すぐSSDやHDDを置き換えられないのか? 🐢
DNAストレージの最大の弱点は、読み書きの速度です。 SSDはミリ秒以下の単位でデータにアクセスできます。 HDDも機械的な動作はあるものの、日常的なコンピューター利用には十分な速度を持ちます。 しかしDNAストレージは、データを書き込むためにDNAを合成し、読み出すためにシーケンサーで配列を読む必要があります。
つまり、DNAストレージはリアルタイム処理には向いていません。 動画編集、ゲーム、AI推論、OS起動、データベース処理のように頻繁に読み書きする用途では、SSDやDRAM、HBM、NANDフラッシュの方が圧倒的に適しています。
そのため、DNAストレージが狙う市場はホットデータではなく、コールドデータです。 ホットデータとは頻繁に読み書きされるデータです。 一方、コールドデータとは、普段はほとんど使わないものの、長期間安全に保存しなければならないデータです。
NANDフラッシュ、HDD、磁気テープ、DNAストレージは同じ「保存技術」ですが、役割が違います。 SSDは高速アクセス、HDDは大容量・低単価、磁気テープはアーカイブ、DNAは超高密度・超長期保存を狙う技術です。
7. DNAformerは何を変える可能性があるのか? ⚙️
DNAストレージの弱点である読み出し速度を改善する研究も進んでいます。 その一つが、イスラエルのTechnion研究チームが発表したDNAformerです。 DNAformerは、AIの深層学習を使ってDNAデータの読み出しとエラー補正を高速化する技術です。
発表によると、DNAformerは従来の高精度手法と比べて大幅に高速な読み出しを実現し、 100MB級のデータ読み出しを約10分で処理できるとされています。 また、読み出し時に起こる塩基の欠落、置換、順序の乱れなどのエラーも補正しやすくなると説明されています。
これは重要な進展ですが、商用SSDと同じ速度になったという意味ではありません。 DNAformerが示しているのは、DNAストレージが「遅すぎて使えない」段階から、 特定のアーカイブ用途では現実的な選択肢になり得る方向へ進んでいるということです。
DNAformerの意味は、DNAストレージをSSDの代替にすることではありません。 長期保存用のアーカイブデータを、より現実的な時間で読み出せる可能性を高めた点にあります。
8. Atlas Data Storageはなぜ注目されるのか? 🏢
DNAストレージが研究段階から商用化段階へ進むうえで注目される企業が、Atlas Data Storageです。 Twist Bioscienceは2025年、DNAデータストレージ事業を独立会社としてスピンアウトし、Atlas Data Storageを設立しました。 この会社には、Bezos ExpeditionsやIn-Q-Telなどを含む投資家が参加したと発表されています。
Atlas Data Storageは、長期アーカイブ用途に向けたDNAストレージの商用化を目指しています。 報道では、1リットル級の容器に数十PB規模のデータを保存できる構想や、映像アーカイブ、AIデータセット、医療・金融データの長期保管が想定用途として取り上げられています。
ここで重要なのは、ターゲットが一般消費者向けの外付けSSDではないことです。 想定されているのは、ハイパースケーラー、映像保存機関、研究機関、金融機関、医療機関、政府・安全保障関連機関のように、 大量のデータを長期間保存しなければならない組織です。
DNAストレージは、スマートフォンや個人PCにすぐ入る技術ではありません。 まずは、動画アーカイブ、AI学習データ、医療記録、金融取引記録、文化財データのような長期保存市場から導入される可能性が高いと見られます。
9. SamsungやSK hynixにとって脅威なのか? 💾
DNAストレージの話を聞くと、Samsung ElectronicsやSK hynixのようなメモリ半導体企業にとって脅威ではないかと考えるかもしれません。 しかし、現時点でDNAストレージがNANDフラッシュ、DRAM、HBMを直接置き換える可能性は低いと考えられます。
理由は用途が違うからです。 DRAMやHBMはAI計算のために高速でデータを出し入れするメモリです。 NANDフラッシュはSSDとして高速ストレージに使われます。 これらはリアルタイム性が重要な市場です。 一方、DNAストレージは超長期保存向けであり、アクセス頻度が低いコールドデータに向いています。
したがって、DNAストレージはメモリ半導体をすぐに破壊する技術ではありません。 むしろ、データ階層の一番下に新しい保存層を作る技術と見る方が自然です。 上位にはHBM、DRAM、NAND SSDがあり、中間にHDDや磁気テープがあり、最下層にDNAアーカイブが入る可能性があります。
DNAストレージはSamsungやSK hynixの主力であるHBM、DRAM、NANDをすぐに奪う技術ではありません。 ただし、長期的にはデータ保存の階層構造を変え、磁気テープや一部のコールドストレージ市場に影響を与える可能性があります。
10. 日本で見るべきポイントは何か? 🇯🇵
日本でこの技術を見るとき、重要なのは半導体競争だけではありません。 日本には放送局、映画会社、研究機関、医療機関、金融機関、自治体、文化財保存機関など、長期保存が必要なデータを大量に持つ組織があります。 これらのデータは毎日使うものではありませんが、失われると大きな損失になります。
たとえば、医療画像、ゲノム情報、金融取引記録、災害記録、研究データ、映像アーカイブ、文化財のデジタルデータは、数十年単位で保存される必要があります。 こうした分野では、保存密度、耐久性、保管コスト、電力コストが重要になります。 DNAストレージは、まさにこの領域で将来的な選択肢になり得ます。
さらに、日本はデータセンター電力の問題にも直面しています。 AI、クラウド、半導体、金融システム、行政DXが進むほど、データ保存量と電力需要は増えます。 その中で、頻繁に使わないデータまで常時電力を使って保管することが合理的なのかという問いが強まります。
日本でDNAストレージを見るポイントは、「次のSSDになるか」ではありません。 医療、金融、放送、文化財、研究、行政の長期アーカイブを、より省スペース・低電力で保存できるかです。
11. これからのリスクと課題は何か? ⚠️
DNAストレージには大きな可能性がありますが、課題も明確です。 第一に、DNA合成コストです。 データをDNAとして保存するには、デジタル情報を塩基配列に変換し、その配列を人工的に合成する必要があります。 この工程が高ければ、商用ストレージとして普及しにくくなります。
第二に、読み出し速度です。 DNAformerのような技術によって改善は進んでいますが、日常的なコンピューター利用に使うにはまだ遅すぎます。 そのため、用途は当面アーカイブ市場に限定される可能性が高いです。
第三に、標準化と運用です。 どの方式でデータを塩基に変換するのか、エラー訂正をどう行うのか、何十年後にも読み出せる規格をどう維持するのかが重要になります。 データ保存は、保存した瞬間ではなく、将来きちんと復元できて初めて意味があります。
DNAストレージは夢の技術ですが、万能ではありません。 高速処理は半導体メモリ、日常保存はSSDやHDD、長期アーカイブは磁気テープやDNAというように、用途ごとに役割が分かれる可能性が高いです。
12. 核心を整理すると 📝
- コンピューターは0と1で情報を保存し、DNAはA・C・G・Tという4種類の塩基で情報を保存します。
- DNAデータストレージは、デジタルデータをDNAの塩基配列に変換して保存する技術です。
- 理論上、DNAは極めて高密度でデータを保存でき、長期保存と低電力保管に強みがあります。
- AIデータセンター時代には、計算能力だけでなく、膨大なデータを長期保存する技術も重要になります。
- 最大の課題は、DNA合成コスト、読み書き速度、エラー訂正、標準化、運用システム化です。
- DNAストレージはSSDやHBMの代替ではなく、長期保存用のコールドデータ市場を狙う技術です。
- 日本では医療、金融、放送、研究、文化財、行政アーカイブなどで将来的な利用可能性があります。
📌 今日のテクノロジー経済ポイント
DNAデータストレージは、0と1のデジタル情報をA・C・G・Tの塩基配列に変換して保存する次世代アーカイブ技術です。
最大の強みは、圧倒的な保存密度、長期安定性、保管中の低電力性です。
ただし、読み書き速度とコストの課題が大きいため、当面はSSDやHDDではなく、長期保存用のコールドデータ市場が主戦場になります。
📝 今日の一言まとめ
DNAデータストレージは、AI時代の巨大データをすぐに使うための技術ではなく、数十年から数千年単位で失ってはいけないデータを保存するための技術です。
参考資料リンク 🔗
- Twist Bioscience – Setting the Data Density Record with DNA Fountain
- University of Washington (2019) – First fully automated DNA data storage
- Microsoft (2019) – With a “hello,” Microsoft and UW demonstrate DNA data storage
- Technion (2025) – DNAformer: Where Nature Meets AI
- Twist Bioscience (2025) – Atlas Data Storage spin-out announcement
- xAI – Colossus AI Supercomputer
- NVIDIA (2024) – Spectrum-X Ethernet Networking Accelerates xAI Colossus
.png)
コメント
コメントを投稿