یک مطالعه پیشرفت گام مهمی در تلاش برای توسعه یک DNAسیستم ذخیره سازی مبتنی بر داده های دیجیتال
دیجیتال داده ها امروزه به دلیل وابستگی ما به گجت ها با سرعت تصاعدی در حال رشد است و به ذخیره سازی طولانی مدت قوی نیاز دارد. ذخیره سازی داده ها کم کم چالش برانگیز می شود زیرا فناوری دیجیتال فعلی قادر به ارائه راه حل نیست. به عنوان مثال، داده های دیجیتالی بیشتری در دو سال گذشته نسبت به کل تاریخ ایجاد شده است کامپیوتر، در واقع 2.5 کوئینتیلیون بایت {1 کوئینتیلیون بایت = 2,500,000،2,500,000,000،XNUMX ترابایت (TB) = XNUMX،XNUMX،XNUMX،XNUMX گیگابایت (GB)} داده هر روز در جهان ایجاد می شود. این شامل دادههای سایتهای شبکههای اجتماعی، تراکنشهای بانکی آنلاین، سوابق شرکتها و سازمانها، دادههای ماهوارهها، نظارت، تحقیق، توسعه و غیره است. این دادهها عظیم و بدون ساختار هستند. بنابراین، در حال حاضر مقابله با نیازهای ذخیره سازی عظیم برای داده ها و رشد تصاعدی آن، به ویژه برای سازمان ها و شرکت هایی که به ذخیره سازی طولانی مدت قوی نیاز دارند، یک چالش بزرگ است.
گزینه های موجود در حال حاضر عبارتند از هارد دیسک، دیسک های نوری (CD)، حافظه های حافظه، درایوهای فلش، و نوارهای پیشرفته تر یا دیسک های نوری BluRay که تقریباً تا 10 ترابایت (TB) داده را ذخیره می کنند. چنین دستگاه های ذخیره سازی اگرچه معمولاً مورد استفاده قرار می گیرند دارای معایب زیادی هستند. اولاً، عمر مفید آنها کم تا متوسط است و باید در شرایط دما و رطوبت ایده آل نگهداری شوند تا بتوانند چندین دهه دوام بیاورند و بنابراین به فضاهای ذخیره سازی فیزیکی طراحی شده خاصی نیاز دارند. تقریباً همه اینها انرژی زیادی مصرف می کنند، حجیم و غیر عملی هستند و در یک سقوط ساده آسیب می بینند. برخی از آنها بسیار گران هستند، اغلب با خطای داده ها مواجه هستند و بنابراین به اندازه کافی قوی نیستند. گزینه ای که به طور جهانی توسط سازمان پذیرفته شده است رایانش ابری نامیده می شود - ترتیبی که در آن یک شرکت اساساً یک سرور "خارجی" را برای رسیدگی به تمام نیازهای IT و ذخیره سازی داده خود استخدام می کند که به آن "ابر" گفته می شود. یکی از معایب اولیه رایانش ابری، مسائل امنیتی و حریم خصوصی و آسیب پذیری در برابر حمله هکرها است. همچنین مسائل دیگری مانند هزینه های بالا، کنترل محدود توسط سازمان مادر و وابستگی به پلت فرم وجود دارد. رایانش ابری هنوز جایگزین خوبی برای ذخیره سازی طولانی مدت است. با این حال، به نظر میرسد اطلاعات دیجیتالی که در سرتاسر جهان تولید میشود، مطمئناً از توانایی ما برای ذخیره آن پیشی میگیرد و راهحلهای قویتری برای مقابله با این سیل دادهها مورد نیاز است و در عین حال مقیاسپذیری برای در نظر گرفتن نیازهای ذخیرهسازی آینده نیز فراهم میشود.
آیا DNA می تواند به ذخیره سازی کامپیوتر کمک کند؟
DNA (دئوکسی ریبونوکلئیک اسید) به عنوان یک رسانه جایگزین هیجان انگیز برای ذخیره سازی داده های دیجیتال در نظر گرفته می شود. DNA این ماده خودتکثیری است که تقریباً در همه موجودات زنده وجود دارد و اطلاعات ژنتیکی ما را تشکیل می دهد. مصنوعی یا مصنوعی DNA یک ماده بادوام است که می تواند با استفاده از ماشین های سنتز الیگونوکلئوتیدی موجود در بازار ساخته شود. مزیت اصلی DNA طول عمر آن است DNA 1000 برابر بیشتر از سیلیکون (تراشه سیلیکون - ماده ای که برای ساخت و ساز استفاده می شود) دوام می آورد کامپیوتر). به طرز شگفت انگیزی، فقط یک میلی متر مکعب DNA می تواند یک کوئینتیلیون بایت داده را در خود جای دهد! DNA همچنین یک ماده فوق فشرده است که هرگز تجزیه نمی شود و می تواند صدها قرن در مکانی خشک و خنک نگهداری شود. ایده استفاده از DNA برای ذخیره سازی برای مدت طولانی به سال 1994 وجود داشته است. DNA - از آنجایی که هر دو نقشه اطلاعات را ذخیره می کنند. یک کامپیوتر تمام داده ها را به صورت 0 و 1 ذخیره می کند و DNA تمام داده های موجود زنده را با استفاده از چهار پایه - تیمین (T)، گوانین (G)، آدنین (A) و سیتوزین (C) ذخیره می کند. بنابراین، DNA را میتوان یک دستگاه ذخیرهسازی استاندارد، درست مانند یک کامپیوتر، نامید، اگر این پایگاهها را بتوان به صورت 0s (پایههای A و C) و 1s (پایههای T و G) نشان داد. DNA سخت و بادوام است، سادهترین بازتاب این است که کد ژنتیکی ما - نقشهای از تمام اطلاعات ذخیره شده در DNA - به طور مؤثر از یک نسل به نسل بعد به روشی مکرر منتقل میشود. همه غولهای نرمافزاری و سختافزاری مشتاق استفاده از DNA مصنوعی برای ذخیرهسازی مقادیر زیادی برای رسیدن به هدف خود در حل آرشیو بلندمدت دادهها هستند. ایده این است که ابتدا کدهای کامپیوتری 0s و 1s را به کد DNA (A، C، T، G) تبدیل کنیم، سپس از کد DNA تبدیل شده برای تولید رشتههای مصنوعی DNA استفاده میشود که سپس میتواند در انبار سرد قرار داده شود. هر زمان که لازم باشد، رشتههای DNA را میتوان از انبار سرد خارج کرد و اطلاعات آنها را با استفاده از دستگاه توالییابی DNA رمزگشایی کرد و توالی DNA در نهایت به فرمت کامپیوتری باینری 1s و 0s برگردانده میشود تا در رایانه خوانده شود.
نشان داده شده است1 که تنها چند گرم DNA می تواند کوئینتیلیون بایت داده را ذخیره کند و آن را تا 2000 سال دست نخورده نگه دارد. با این حال، این درک ساده با چالش هایی روبرو شده است. اولاً، نوشتن داده ها در DNA بسیار پرهزینه است و همچنین به طور دردناکی کند است، یعنی تبدیل واقعی 0s و 1s به پایگاه های DNA (A، T، C، G). ثانیاً، هنگامی که داده ها بر روی DNA "نوشتن" می شوند، یافتن و بازیابی فایل ها چالش برانگیز است و به تکنیکی به نام نیاز دارد. DNA توالی - فرآیند تعیین ترتیب دقیق پایه ها در a DNA مولکول - پس از آن داده ها به 0 و 1 رمزگشایی می شوند.
یک مطالعه اخیر2 توسط دانشمندان مایکروسافت ریسرچ و دانشگاه واشنگتن به "دسترسی تصادفی" در ذخیره سازی DNA دست یافته اند. جنبه "دسترسی تصادفی" بسیار مهم است زیرا به این معنی است که اطلاعات را می توان به یا از مکانی (به طور کلی یک حافظه) که در آن هر مکان، بدون توجه به جایی که در دنباله است و می توان مستقیماً به آن دسترسی داشت، منتقل کرد. با استفاده از این تکنیک دسترسی تصادفی، میتوان فایلها را از ذخیرهسازی DNA به شیوهای انتخابی در مقایسه با گذشته بازیابی کرد، زمانی که چنین بازیابی نیاز به توالیبندی و رمزگشایی کل مجموعه داده DNA برای یافتن و استخراج چند فایل مورد نظر داشت. اهمیت «دسترسی تصادفی» زمانی که حجم دادهها افزایش مییابد و بزرگ میشود، بیشتر میشود، زیرا مقدار توالیسازی را که باید انجام شود کاهش میدهد. این برای اولین بار است که دسترسی تصادفی در چنین مقیاس بزرگی نشان داده شده است. محققان همچنین الگوریتمی را برای رمزگشایی و بازیابی داده ها با کارآمدتر با تحمل بیشتر در برابر خطاهای داده ایجاد کرده اند که روند توالی یابی را نیز سریعتر می کند. بیش از 13 میلیون اولیگونوکلئوتید DNA مصنوعی در این مطالعه کدگذاری شد که دادههایی با حجم 200 مگابایت شامل 35 فایل (شامل ویدئو، صدا، تصویر و متن) در اندازههای بین 29 تا 44 مگابایت بود. این فایل ها به صورت جداگانه و بدون هیچ خطایی بازیابی شدند. همچنین، نویسندگان الگوریتمهای جدیدی ابداع کردهاند که در نوشتن و خواندن توالیهای DNA قویتر و مقاومتر به خطا هستند. این مطالعه منتشر شده در بیوتکنولوژی طبیعت در یک پیشرفت بزرگ که یک سیستم قابل دوام و در مقیاس بزرگ را برای ذخیره و بازیابی DNA نشان می دهد.
سیستم ذخیرهسازی DNA بسیار جذاب به نظر میرسد، زیرا دارای چگالی دادههای بالا، پایداری بالا و ذخیرهسازی آسان است، اما بدیهی است که قبل از اینکه بتوان آن را در سراسر جهان پذیرفت، چالشهای زیادی دارد. چند فاکتور رمزگشایی زمان و کار فشرده DNA (توالی یابی) و همچنین سنتز DNA است. DNA. این تکنیک به دقت بیشتر و پوشش وسیع تری نیاز دارد. حتی اگر پیشرفت هایی در این زمینه صورت گرفته باشد، فرمت دقیقی که داده ها در بلندمدت در آن ذخیره خواهند شد DNA هنوز در حال تکامل است. مایکروسافت متعهد شده است که تولید DNA مصنوعی را بهبود بخشد و با چالشهای طراحی یک DNA کاملاً عملیاتی مقابله کند DNA سیستم ذخیره سازی تا سال 2020
***
{شما میتوانید مقاله پژوهشی اصلی را با کلیک بر روی پیوند DOI که در فهرست منابع ذکر شده در زیر آمده است بخوانید}
منبع (ها)
1. Erlich Y and Zielinski D 2017. DNA Fountain یک معماری ذخیره سازی قوی و کارآمد را امکان پذیر می کند. علوم پایه. 355(6328). https://doi.org/10.1126/science.aaj2038
2. ارگانیک ال و همکاران. 2018. دسترسی تصادفی در ذخیره سازی داده های DNA در مقیاس بزرگ. بیوتکنولوژی طبیعت 36. https://doi.org/10.1038/nbt.4079