DNA به‌عنوان وسیله‌ای برای ذخیره داده‌های رایانه‌ای گسترده: به زودی یک واقعیت؟ -

یک مطالعه پیشرفت گام مهمی در تلاش برای توسعه یک DNAسیستم ذخیره سازی مبتنی بر داده های دیجیتال

دیجیتال داده ها امروزه به دلیل وابستگی ما به گجت ها با سرعت تصاعدی در حال رشد است و به ذخیره سازی طولانی مدت قوی نیاز دارد. ذخیره سازی داده ها کم کم چالش برانگیز می شود زیرا فناوری دیجیتال فعلی قادر به ارائه راه حل نیست. به عنوان مثال، داده های دیجیتالی بیشتری در دو سال گذشته نسبت به کل تاریخ ایجاد شده است کامپیوتر، در واقع 2.5 کوئینتیلیون بایت {1 کوئینتیلیون بایت = 2,500,000،2,500,000,000،XNUMX ترابایت (TB) = XNUMX،XNUMX،XNUMX،XNUMX گیگابایت (GB)} داده هر روز در جهان ایجاد می شود. این شامل داده‌های سایت‌های شبکه‌های اجتماعی، تراکنش‌های بانکی آنلاین، سوابق شرکت‌ها و سازمان‌ها، داده‌های ماهواره‌ها، نظارت، تحقیق، توسعه و غیره است. این داده‌ها عظیم و بدون ساختار هستند. بنابراین، در حال حاضر مقابله با نیازهای ذخیره سازی عظیم برای داده ها و رشد تصاعدی آن، به ویژه برای سازمان ها و شرکت هایی که به ذخیره سازی طولانی مدت قوی نیاز دارند، یک چالش بزرگ است.

گزینه های موجود در حال حاضر عبارتند از هارد دیسک، دیسک های نوری (CD)، حافظه های حافظه، درایوهای فلش، و نوارهای پیشرفته تر یا دیسک های نوری BluRay که تقریباً تا 10 ترابایت (TB) داده را ذخیره می کنند. چنین دستگاه های ذخیره سازی اگرچه معمولاً مورد استفاده قرار می گیرند دارای معایب زیادی هستند. اولاً، عمر مفید آنها کم تا متوسط است و باید در شرایط دما و رطوبت ایده آل نگهداری شوند تا بتوانند چندین دهه دوام بیاورند و بنابراین به فضاهای ذخیره سازی فیزیکی طراحی شده خاصی نیاز دارند. تقریباً همه اینها انرژی زیادی مصرف می کنند، حجیم و غیر عملی هستند و در یک سقوط ساده آسیب می بینند. برخی از آنها بسیار گران هستند، اغلب با خطای داده ها مواجه هستند و بنابراین به اندازه کافی قوی نیستند. گزینه ای که به طور جهانی توسط سازمان پذیرفته شده است رایانش ابری نامیده می شود - ترتیبی که در آن یک شرکت اساساً یک سرور "خارجی" را برای رسیدگی به تمام نیازهای IT و ذخیره سازی داده خود استخدام می کند که به آن "ابر" گفته می شود. یکی از معایب اولیه رایانش ابری، مسائل امنیتی و حریم خصوصی و آسیب پذیری در برابر حمله هکرها است. همچنین مسائل دیگری مانند هزینه های بالا، کنترل محدود توسط سازمان مادر و وابستگی به پلت فرم وجود دارد. رایانش ابری هنوز جایگزین خوبی برای ذخیره سازی طولانی مدت است. با این حال، به نظر می‌رسد اطلاعات دیجیتالی که در سرتاسر جهان تولید می‌شود، مطمئناً از توانایی ما برای ذخیره آن پیشی می‌گیرد و راه‌حل‌های قوی‌تری برای مقابله با این سیل داده‌ها مورد نیاز است و در عین حال مقیاس‌پذیری برای در نظر گرفتن نیازهای ذخیره‌سازی آینده نیز فراهم می‌شود.

آیا DNA می تواند به ذخیره سازی کامپیوتر کمک کند؟

DNA (دئوکسی ریبونوکلئیک اسید) به عنوان یک رسانه جایگزین هیجان انگیز برای ذخیره سازی داده های دیجیتال در نظر گرفته می شود. DNA این ماده خودتکثیری است که تقریباً در همه موجودات زنده وجود دارد و اطلاعات ژنتیکی ما را تشکیل می دهد. مصنوعی یا مصنوعی DNA یک ماده بادوام است که می تواند با استفاده از ماشین های سنتز الیگونوکلئوتیدی موجود در بازار ساخته شود. مزیت اصلی DNA طول عمر آن است DNA 1000 برابر بیشتر از سیلیکون (تراشه سیلیکون - ماده ای که برای ساخت و ساز استفاده می شود) دوام می آورد کامپیوتر). به طرز شگفت انگیزی، فقط یک میلی متر مکعب DNA می تواند یک کوئینتیلیون بایت داده را در خود جای دهد! DNA همچنین یک ماده فوق فشرده است که هرگز تجزیه نمی شود و می تواند صدها قرن در مکانی خشک و خنک نگهداری شود. ایده استفاده از DNA برای ذخیره سازی برای مدت طولانی به سال 1994 وجود داشته است. DNA - از آنجایی که هر دو نقشه اطلاعات را ذخیره می کنند. یک کامپیوتر تمام داده ها را به صورت 0 و 1 ذخیره می کند و DNA تمام داده های موجود زنده را با استفاده از چهار پایه - تیمین (T)، گوانین (G)، آدنین (A) و سیتوزین (C) ذخیره می کند. بنابراین، DNA را می‌توان یک دستگاه ذخیره‌سازی استاندارد، درست مانند یک کامپیوتر، نامید، اگر این پایگاه‌ها را بتوان به صورت 0s (پایه‌های A و C) و 1s (پایه‌های T و G) نشان داد. DNA سخت و بادوام است، ساده‌ترین بازتاب این است که کد ژنتیکی ما - نقشه‌ای از تمام اطلاعات ذخیره شده در DNA - به طور مؤثر از یک نسل به نسل بعد به روشی مکرر منتقل می‌شود. همه غول‌های نرم‌افزاری و سخت‌افزاری مشتاق استفاده از DNA مصنوعی برای ذخیره‌سازی مقادیر زیادی برای رسیدن به هدف خود در حل آرشیو بلندمدت داده‌ها هستند. ایده این است که ابتدا کدهای کامپیوتری 0s و 1s را به کد DNA (A، C، T، G) تبدیل کنیم، سپس از کد DNA تبدیل شده برای تولید رشته‌های مصنوعی DNA استفاده می‌شود که سپس می‌تواند در انبار سرد قرار داده شود. هر زمان که لازم باشد، رشته‌های DNA را می‌توان از انبار سرد خارج کرد و اطلاعات آن‌ها را با استفاده از دستگاه توالی‌یابی DNA رمزگشایی کرد و توالی DNA در نهایت به فرمت کامپیوتری باینری 1s و 0s برگردانده می‌شود تا در رایانه خوانده شود.

نشان داده شده است¹ که تنها چند گرم DNA می تواند کوئینتیلیون بایت داده را ذخیره کند و آن را تا 2000 سال دست نخورده نگه دارد. با این حال، این درک ساده با چالش هایی روبرو شده است. اولاً، نوشتن داده ها در DNA بسیار پرهزینه است و همچنین به طور دردناکی کند است، یعنی تبدیل واقعی 0s و 1s به پایگاه های DNA (A، T، C، G). ثانیاً، هنگامی که داده ها بر روی DNA "نوشتن" می شوند، یافتن و بازیابی فایل ها چالش برانگیز است و به تکنیکی به نام نیاز دارد. DNA توالی - فرآیند تعیین ترتیب دقیق پایه ها در a DNA مولکول - پس از آن داده ها به 0 و 1 رمزگشایی می شوند.

یک مطالعه اخیر² توسط دانشمندان مایکروسافت ریسرچ و دانشگاه واشنگتن به "دسترسی تصادفی" در ذخیره سازی DNA دست یافته اند. جنبه "دسترسی تصادفی" بسیار مهم است زیرا به این معنی است که اطلاعات را می توان به یا از مکانی (به طور کلی یک حافظه) که در آن هر مکان، بدون توجه به جایی که در دنباله است و می توان مستقیماً به آن دسترسی داشت، منتقل کرد. با استفاده از این تکنیک دسترسی تصادفی، می‌توان فایل‌ها را از ذخیره‌سازی DNA به شیوه‌ای انتخابی در مقایسه با گذشته بازیابی کرد، زمانی که چنین بازیابی نیاز به توالی‌بندی و رمزگشایی کل مجموعه داده DNA برای یافتن و استخراج چند فایل مورد نظر داشت. اهمیت «دسترسی تصادفی» زمانی که حجم داده‌ها افزایش می‌یابد و بزرگ می‌شود، بیشتر می‌شود، زیرا مقدار توالی‌سازی را که باید انجام شود کاهش می‌دهد. این برای اولین بار است که دسترسی تصادفی در چنین مقیاس بزرگی نشان داده شده است. محققان همچنین الگوریتمی را برای رمزگشایی و بازیابی داده ها با کارآمدتر با تحمل بیشتر در برابر خطاهای داده ایجاد کرده اند که روند توالی یابی را نیز سریعتر می کند. بیش از 13 میلیون اولیگونوکلئوتید DNA مصنوعی در این مطالعه کدگذاری شد که داده‌هایی با حجم 200 مگابایت شامل 35 فایل (شامل ویدئو، صدا، تصویر و متن) در اندازه‌های بین 29 تا 44 مگابایت بود. این فایل ها به صورت جداگانه و بدون هیچ خطایی بازیابی شدند. همچنین، نویسندگان الگوریتم‌های جدیدی ابداع کرده‌اند که در نوشتن و خواندن توالی‌های DNA قوی‌تر و مقاوم‌تر به خطا هستند. این مطالعه منتشر شده در بیوتکنولوژی طبیعت در یک پیشرفت بزرگ که یک سیستم قابل دوام و در مقیاس بزرگ را برای ذخیره و بازیابی DNA نشان می دهد.

سیستم ذخیره‌سازی DNA بسیار جذاب به نظر می‌رسد، زیرا دارای چگالی داده‌های بالا، پایداری بالا و ذخیره‌سازی آسان است، اما بدیهی است که قبل از اینکه بتوان آن را در سراسر جهان پذیرفت، چالش‌های زیادی دارد. چند فاکتور رمزگشایی زمان و کار فشرده DNA (توالی یابی) و همچنین سنتز DNA است. DNA. این تکنیک به دقت بیشتر و پوشش وسیع تری نیاز دارد. حتی اگر پیشرفت هایی در این زمینه صورت گرفته باشد، فرمت دقیقی که داده ها در بلندمدت در آن ذخیره خواهند شد DNA هنوز در حال تکامل است. مایکروسافت متعهد شده است که تولید DNA مصنوعی را بهبود بخشد و با چالش‌های طراحی یک DNA کاملاً عملیاتی مقابله کند DNA سیستم ذخیره سازی تا سال 2020

***

{شما می‌توانید مقاله پژوهشی اصلی را با کلیک بر روی پیوند DOI که در فهرست منابع ذکر شده در زیر آمده است بخوانید}

منبع (ها)

1. Erlich Y and Zielinski D 2017. DNA Fountain یک معماری ذخیره سازی قوی و کارآمد را امکان پذیر می کند. علوم پایه. 355(6328). https://doi.org/10.1126/science.aaj2038

2. ارگانیک ال و همکاران. 2018. دسترسی تصادفی در ذخیره سازی داده های DNA در مقیاس بزرگ. بیوتکنولوژی طبیعت 36. https://doi.org/10.1038/nbt.4079

DNA به‌عنوان وسیله‌ای برای ذخیره داده‌های رایانه‌ای گسترده: به زودی یک واقعیت؟

مشترک شدن در خبرنامه ما

رایج ترین مقالات

ریتزر

پست های محبوب

گروه محبوب