ژنتیک و ژنومیک هر دو در سلامت و بیماری نقش دارند. ژنتیک به مطالعه ژنها و نحوه انتقال صفات یا شرایط خاص از نسلی به نسل دیگر اشاره دارد. ژنومیک مطالعه تمام ژنهای یک فرد (ژنوم) را توصیف میکند. در این مقاله ابتدا به بررسی تفاوتهای ژنتیک و ژنومیک پرداخته و سپس به توضیح کاربرد یک رشتهی نوظهور به نام علم داده (Data Science) در تجزیه و تحلیل داده های ژنتیکی و ژنومیکی می پردازیم.
تفاوت ژنتیک و ژنومیک در چیست؟
ژنتیک اصطلاحی است که به مطالعه ژنها و نقش آنها در وراثت اشاره دارد – به عبارت دیگر، نحوه انتقال برخی از صفات یا شرایط از نسلی به نسل دیگر. ژنتیک شامل مطالعات علمی ژنها و اثرات آنها میشود. ژنها (واحدهای وراثت) حاوی دستورالعملهایی برای ساخت پروتئینهایی هستند که فعالیت سلولها و عملکردهای بدن را هدایت میکنند. نمونههایی از اختلالات ژنتیکی یا ارثی عبارتند از فیبروز کیستیک (cystic fibrosis)، بیماری هانتینگتون (Huntington’s disease) و فنیل کتونوری (یا PKU که مخفف phenylketonuria است).
ژنومیک (Genomic) اصطلاح جدیدتری است که مطالعه همه ژنهای یک فرد (ژنوم)، از جمله برهمکنش آن ژنها با یکدیگر و با محیط اطراف را توصیف میکند. ژنومیک شامل مطالعه علمی بیماریهای پیچیده مانند بیماریهای قلبی، آسم، دیابت و سرطان است زیرا این بیماریها معمولاً بیشتر توسط ترکیبی از عوامل ژنتیکی و محیطی ایجاد میشوند تا فقط ژنها. ژنومیک امکانات جدیدی را برای معالجات و درمان برخی بیماریهای پیچیده و همچنین روشهای تشخیصی جدید ارائه میدهد.
اهمیت ژنتیک و ژنومیک برای سلامتی ما در چیست؟
ژنتیک و ژنومیک هر دو در سلامت و بیماری ما نقش دارند. ژنتیک به افراد کمک میکند تا در مورد چگونگی ارثی بودن بیماریهایی مانند کمخونی داسیشکل و فیبروز کیستیک، گزینههای غربالگری و آزمایشی در دسترس، و در برخی از شرایط ژنتیکی، درمانهای در دسترس بیاموزند.
ژنومیک به محققان کمک میکند تا دریابند چرا برخی از افراد به دلیل برخی عفونتها، عوامل محیطی و رفتارها(ی سبک زندگی) بیمار میشوند و برخی دیگر به این موارد پاسخ متفاوتی میدهند.
بهعنوان مثال، برخی از افراد هستند که در تمام زندگی خود ورزش میکنند، رژیم غذایی سالمی دارند، معاینات پزشکی منظمی انجام میدهند و در سن ۴۰ سالگی بر اثر حمله قلبی میمیرند. همچنین افرادی هستند که سیگار میکشند، هرگز ورزش نمیکنند، غذاهای ناسالم میخورند و تا ۱۰۰ سالگی زندگی میکنند. درواقع ژنومیک میتواند کلید درک این تفاوتها باشد.
جدا از اتفاقات (مانند سقوط، تصادفات وسایل نقلیه، مسمومیت و …)، عوامل ژنومی در ۹ مورد از ده مورد علت اصلی مرگومیر در ایالات متحده نقش دارند (بهعنوان مثال، بیماری قلبی، سرطان و دیابت. نگاه کنید به: علل اصلی مرگو میر در ایالات متحده). همه انسانها از نظر ساختار ژنتیکی ۹۹.۹ درصد یکسان هستند. تفاوت در ۰.۱ درصد باقیمانده سرنخهای مهمی در مورد علل بیماریها دارد.
به دست آوردن درک بهتر از تعاملات بین ژنها و محیط با استفاده از ژنومیک به محققان کمک میکند تا راههای بهتری برای بهبود سلامت و پیشگیری از بیماریها پیدا کنند، مانند اصلاح رژیم غذایی و برنامههای ورزشی برای جلوگیری یا به تاخیر انداختن ابتلا به دیابت نوع ۲ در افراد دارای استعداد ژنتیکی برای ابتلا به این بیماری.
Photo by cottonbro from Pexels
چرا ژنتیک و ژنومیک برای سلامت خانوادگی مهم است؟
درک بیشتر بیماریهای ناشی از یک ژن (با استفاده از ژنتیک) و بیماریهای پیچیده ناشی از چندین ژن و عوامل محیطی (با استفاده از ژنومیک) میتواند به تشخیصها، مداخلات و درمانهای هدفمند سریعتر منجر شود. سلامت یک فرد تحت تأثیر سابقه خانوادگی و عوامل محیطی مشترک است. این موضوع، سابقه خانوادگی را به ابزاری مهم و شخصیسازی شده تبدیل میکند که میتواند به شناسایی بسیاری از عوامل ایجادکننده بیماریهایی که دارای یک جزء ژنتیکی نیز هستند، کمک کند.
سابقه خانوادگی میتواند بهعنوان سنگبنای تحقیق درمورد شرایط ژنتیکی و ژنومی در یک خانواده، و توسعه رویکردهای فردی برای پیشگیری، مداخله و درمان بیماری باشد.
تکنیک ها و فناوری های جدید ژنتیکی و ژنومی
- پروتگانشناسی یا پروتئومیکس (Proteomics: دانش بررسی ساختار و عملکرد پروتئینها)
پسوند “-ome” از زبان یونانی به معنی همه، همه یا کامل می آید. این در ابتدا در “ژنوم” استفاده می شد، که به تمام ژن های یک فرد یا موجودات دیگر اشاره دارد. با توجه به موفقیت پروژههای زیستشناسی در مقیاس بزرگ مانند تعیین توالی ژنوم انسان، پسوند “-ome” اکنون در زمینههای تحقیقاتی دیگر نیز استفاده میشود. پروتئومیکس یک نمونه از آن است.
توالی DNA ژنها حاوی دستورالعملها یا کدهایی برای ساخت پروتئینها هستند. این DNA به یک مولکول مرتبط به نام RNA رونویسی میشود و سپس به پروتئین ترجمه میشود. بنابراین، پروتئومیکس یک تجزیه و تحلیل مشابه در مقیاس بزرگ از همه پروتئینهای موجود در یک ارگانیسم، نوع بافت یا سلول است. پروتئومیکس میتواند برای آشکارسازی پروتئینهای خاص و غیرطبیعی که منجر به بیماریهایی مانند انواع خاصی از سرطان میشود، استفاده شود.
- فارماکوژنتیک (Pharmacogenetics: داروژنشناسی) و فارماکوژنومیک (Pharmacogenomics)
اصطلاحات “فارماکوژنتیک” و “فارماکوژنومیک” در توصیف تلاقی دو زمینهی علمی فارماکولوژی (مطالعه داروها) و تنوع ژنتیکی در تعیین پاسخ فرد به داروهای خاص اغلب به جای یکدیگر استفاده میشوند.
فارماکوژنتیک رشته مطالعاتی است که به تنوع پاسخ به داروها به دلیل تنوع در ژنهای منفرد میپردازد. فارماکوژنتیک اطلاعات ژنتیکی فرد را درمورد گیرندههای دارویی خاص و نحوه انتقال و متابولیسم داروها توسط بدن در نظر میگیرد. هدف فارماکوژنتیک ایجاد یک دارودرمانی فردی است که امکان انتخاب و بهترین دوز دارو را فراهم میکند. یک نمونه از این زمینهی علمی داروی سرطان سینه به نام تراستوزوماب (trastuzumab یا Herceptin) است. این درمان فقط برای زنانی کار میکند که تومورهایشان مشخصات ژنتیکی خاصی دارد که منجر به تولید بیش از حد پروتئینی به نام HER2 می شود.
فارماکوژنومیک مشابه فارماکوژنتیک است، با این تفاوت که معمولاً شامل جستجوی تنوعات در چندین ژن است که با تنوع در پاسخ دارویی مرتبط است. از آنجایی که فارماکوژنومیک یکی از فناوریهای “omic” در مقیاس بزرگ است، میتواند به جای ژنهای منفرد کل ژنوم را بررسی کند. مطالعات فارماکوژنومیک همچنین ممکن است تنوع ژنتیکی را در میان گروههای بزرگی از افراد (جمعیتها) بررسی کند تا ببیند داروهای مختلف چگونه میتواند بر گروههای نژادی یا قومی مختلف تأثیر بگذارد.
مطالعات فارماکوژنتیک و فارماکوژنومیک به ساخت داروهایی منجر میشود که میتوانند برای افراد خاص ساخته شوند و با ساختار ژنتیکی خاص هر فرد سازگار شوند. اگرچه محیط، رژیم غذایی، سن، سبک زندگی و وضعیت سلامت فرد نیز میتواند بر پاسخ بدن آن فرد به داروها تأثیر بگذارد، اما درک ساختار ژنتیکی یک فرد کلیدی برای ایجاد داروهای شخصیسازیشده است که بهتر عمل میکنند و عوارض جانبی کمتری نسبت به داروهای یکدست برای همه -که امروزه رایج هستند- دارند.
بهعنوان مثال، سازمان غذا و داروی ایالات متحده (FDA) آزمایش ژنتیکی را قبل از دادن داروی شیمیدرمانی مرکاپتوپورین (Purinethol) به بیماران مبتلا به لوسمی لنفوبلاستیک حاد توصیه میکند. برخی از افراد یک نوع ژنتیکی دارند که در توانایی آنها برای پردازش این دارو اختلال ایجاد میکند. این مشکل پردازش میتواند عوارض جانبی شدیدی ایجاد کند، مگر اینکه دوز استاندارد مطابق با ساختار ژنتیکی بیمار تنظیم شود.
- درمان با سلولهای بنیادی
سلولهای بنیادی دو ویژگی مهم دارند. اول، سلولهای بنیادی سلولهای غیرتخصصی هستند که میتوانند به سلولهای مختلف بدن تبدیل شوند. دوم اینکه سلولهای بنیادی میتوانند در حالت غیرتخصصی خود باقی بمانند و از خود کپی ایجاد کنند.
سلولهای بنیادی جنینی از جنین در مراحل اولیه رشد (مرحلهی بلاستوسیست) حاصل میشوند. سلولهای بنیادی بالغ از بافتهای کاملاً توسعهیافتهتر مانند خون بند ناف در نوزادان، خون در گردش، مغز استخوان یا پوست بدست میآیند.
امروزه محققان حوزهی پزشکی استفاده از سلولهای بنیادی را برای ترمیم یا جایگزینی بافتهای آسیبدیده بدن استفاده میکنند. سلولهای بنیادی جنینی توانایی تبدیل شدن از بلاستوسیست به هر نوع بافتی (پوست، کبد، کلیه، خون و غیره) که در یک انسان بالغ یافت میشود را دارند. سلولهای بنیادی بالغ از نظر پتانسیل، محدودتر هستند (بهعنوان مثال، سلولهای بنیادی کبد میتوانند فقط به سلولهای کبدی تبدیل شوند).
Photo by cottonbro from Pexels
در پیوند اعضا، زمانی که بافتهای اهدایی در بدن بیمار قرار میگیرد، این احتمال وجود دارد که سیستم ایمنی بیمار واکنش نشان دهد و بافت اهداشده را بهعنوان “عامل خارجی” پس بزند. با این حال، با استفاده از سلولهای بنیادی، ممکن است خطر این رد ایمنی کمتر باشد و درمان هم موفقیتآمیزتر باشد.
سلولهای بنیادی در آزمایشهایی برای تشکیل سلولهای مغز استخوان، قلب، عروق خونی و ماهیچهها استفاده شدهاند. از دهه ۱۹۹۰، سلولهای بنیادی خون بند ناف برای درمان مشکلات قلبی و سایر مشکلات جسمی در کودکانی که شرایط متابولیک نادری دارند، یا برای درمان کودکان مبتلا به کمخونیها و لوسمیهای خاص استفاده شده است. بهعنوان مثال، یکی از گزینههای درمانی برای لوسمی لنفوبلاستیک حاد دوران کودکی درمان پیوند سلولهای بنیادی است.
بحثهای زیادی درمورد استفاده از سلولهای بنیادی جنینی، بهویژه درمورد خلق جنینهای انسانی برای استفاده در آزمایشها وجود داشته است. در سال ۱۹۹۵، کنگره آمریکا ممنوعیت تأمین مالی دولتی برای تحقیقات استفاده از جنین انسان را تصویب کرد. با این حال، این محدودیتها باعث نشده است که محققان در ایالات متحده و جاهای دیگر برای ایجاد خطوط سلولی جنینی و انجام تحقیقات با آنها از بودجه خصوصی استفاده نکنند.
جنینهای چنین تحقیقاتی معمولاً از جنینهایی هستند که از تخمکهایی که در شرایط آزمایشگاهی بارور شدهاند – مانند یک کلینیک لقاح آزمایشگاهی – ایجاد میشوند و سپس با رضایت آگاهانه اهداکنندگان برای اهداف تحقیقاتی اهدا میشوند.
- Cloning یا همسانهسازی
همسانهسازی میتواند درمورد ژنها، سلولها یا موجودات کامل باشد. درمورد یک سلول، همسانهسازی به هر سلول ژنتیکی یکسان در جمعیتی اطلاق میشود که از یک جد منفرد و مشترک میآید. بهعنوان مثال، وقتی یک سلول باکتریایی تک DNA خود را کپی میکند و هزاران بار تقسیم میشود، تمام سلولهایی که تشکیل میشوند حاوی DNA یکسان هستند و همسانه های یک سلول اجدادی باکتریایی مشترک خواهند بود.
همسانهسازی ژن شامل دستکاری هایی برای ایجاد چند نسخه یکسان از یک ژن واحد از یک ژن جد یکسان است. همسانهسازی ارگانیسم به معنای ساختن یک کپی ژنتیکی یکسان از تمام سلولها، بافتها و اندامهای سازنده یک ارگانیسم است. دو نوع عمده همسانهسازی وجود دارد که ممکن است مربوط به انسان یا سایر حیوانات باشد: همسانهسازی درمانی و همسانهسازی تولید مثلی.
همسانهسازی درمانی شامل رشد سلولها یا بافتهای همسانهسازیشده از یک فرد، مانند بافت کبد جدید برای بیمار مبتلا به بیماری کبدی است. چنین تلاشهایی در همسانهسازی معمولاً شامل استفاده از سلولهای بنیادی است. هسته از سلول بدن بیمار، مثلا از سلول کبد، گرفته میشود و در تخمکی که هستهی آن برداشته شده، قرار میگیرد. این روند در نهایت یک بلاستوسیست تولید میکند که سلولهای بنیادی آن میتواند برای ایجاد بافت جدیدی که از نظر ژنتیکی با بافت بیمار یکسان است مورد استفاده قرار گیرد.
همسانهسازی تولیدمثلی فرآیندی است که برای تولید یک حیوان کامل استفاده میشود و دارای DNA هستهای مشابه با حیوان فعلی یا قبلی است. اولین حیوانات همسانهسازیشده قورباغهها بودند. دالی (Dolly)، که یک گوسفند معروف است، نمونهی دیگری از همسانهسازی تولیدمثلی است. با این حال، میزان موفقیت همسانهسازی حیوانات بسیار پایین بوده است. در سال ۲۰۰۵، محققان کره جنوبی ادعا کردند که با همسانهسازی مواد ژنتیکی از بیماران، خط سلولهای بنیادی جنینی انسان را تولید کردهاند. اما بعداً گزارش شد که این دادهها جعل شده است.
Photo by Markus Spiske from Pexels
کاربرد علم داده در زمینهی ژنومیک چیست؟
با استفاده از کاوش عمیقتر در ژنوم و تجزیه و تحلیل و تفسیر دادههای ژنومی جمعآوریشده به درک بهتر سلامت و بیماری انسان کمک میکند. اما در این بین سؤالاتی درمورد حریم خصوصی و اخلاقیات نیز مطرح خواهد شد.
- علم داده ژنومیک زمینهای از مطالعات علمی است که محققان را قادر میسازد تا از روشهای محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالیهای DNA استفاده کنند.
- برآوردها پیشبینی میکنند که تحقیقات در زمینهی علم ژنومیک در دهه آینده بین ۲ تا ۴۰ اگزابایت داده تولید خواهد کرد.
- توانایی ما در تعیین توالی DNA بسیار بیشتر از تواناییهایمان در رمزگشایی اطلاعات موجود در آن است، بنابراین علم داده ژنومیک زمینه تحقیقاتی پرجنبوجوشی برای سالهای آینده خواهد بود.
- اجزای علم داده ژنومیک مجموعهای از مسئولیتهای اخلاقی را نیز به همراه دارد، زیرا دادههای توالی هر فرد با مسائل مربوط به حریم خصوصی و هویت آن فرد نیز مرتبط است.
با رشد سریع پروژههای تحقیقاتی زیستپزشکی میزان دادههای ژنومیکی تولیدشده نیز در حال افزایش است، بهطوری که در حال حاضر هر سال تقریباً ۲ تا ۴۰ میلیارد گیگابایت داده تولید میشود. محققان در تلاش هستند تا اطلاعات ارزشمندی را از چنین مجموعه دادههای پیچیده و بزرگی استخراج کنند تا بتوانند سلامت و بیماری انسان را بهتر درک کنند.
علم داده ژنومیک چیست؟
علم داده ژنومیک زمینهای از مطالعات است که محققان را قادر میسازد تا از روشهای محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالی DNA استفاده کنند. این ابزارهای علم داده که در زمینه پزشکی ژنومیک به کار میروند، به محققان و پزشکان کمک میکنند تا چگونگی تأثیر تفاوت در DNA بر سلامت و بیماری انسان را کشف کنند.
علم داده ژنومیک بهعنوان یک زمینه تحقیقاتی در دهه ۱۹۹۰ ظهور کرد تا دو فعالیت آزمایشگاهی را گرد هم آورد:
- آزمایش: تولید اطلاعات ژنومیکی از مطالعه ژنوم موجودات زنده.
- تجزیه و تحلیل دادهها: استفاده از ابزارهای آماری و محاسباتی برای تجزیه و تحلیل و مصورسازی دادههای ژنومیکی که شامل پردازش و ذخیره دادهها و استفاده از الگوریتمها و نرمافزارها برای ایجاد پیشبینیهایی بر اساس دادههای ژنومیکی موجود است.
هر دو فعالیت به محققان کمک میکند تا از مقادیر وسیعی از دادههای ژنومیکی اطلاعات مناسبی کسب کنند.
چرا ژنومیک داده های زیادی تولید میکند؟
ژنومیک انسان در اوایل دهه ۲۰۰۰ مطرح شد، زمانیکه پروژه ژنوم انسانی با موفقیت اولین توالی ژنوم انسان را ایجاد کرد. هر یک از تریلیونها سلول در بدن انسان حاوی یک کپی کامل از ژنوم است، یعنی نقشه DNA ما. اکثر سلولها در واقع دو نسخه از ژنوم دارند که روی هم حدود ۶ میلیارد حرف DNA را منعکس میکنند.
اکنون محققان، دادههای ژنومیکی بیشتری نسبت به قبل تولید میکنند تا بفهمند ژنوم چگونه بر سلامت و بیماری انسان تأثیر میگذارد. این دادهها از میلیونها نفر در جمعیتهای مختلف در سراسر جهان به دست آمده است. اطلاعات مربوط به یک توالی ژنوم انسانی بهتنهایی ۲۰۰ گیگابایت را اشغال میکند.
تخمین زده میشود که برای ذخیره دادههای توالی ژنومی تولیدشده در سراسر جهان تا سال ۲۰۲۵ به ۴۰ اگزابایت فضا نیاز داشته باشیم. برای مقایسه خوب است بدانید که پنج اگزابایت میتواند تمام کلماتی را که انسانها گفتهاند را ذخیره کند.
به دلیل حجم قابل توجهی از دادههای پیچیده مرتبط با ژنوم انسان، ژنومیک اکنون به عنوان یک رشته “کلان داده (big data)” در نظر گرفته میشود.
دانشمندان، داده های ژنومیکی را چگونه مطالعه میکنند؟
محققان برای یافتن و تفسیر اطلاعات بیولوژیکی پنهان در DNA هر فرد و همچنین مدیریت حجم زیادی از دادههای تولیدشده در پروژههای تحقیقاتی ژنومیک به ابزارهای محاسباتی و تحلیلی خاصی نیاز دارند.
محققان از ابزارهای نرمافزاری خاصی به نام aligners برای تعیین محل قرارگیری تکههای تکیتوالی DNA در هر قسمت از یک توالی ژنوم مرجع استفاده میکنند.
Photo by Christina Morillo from Pexels
در مرحله بعد که “variant callers” نامیده میشود مکان هایی که یک توالی ژنوم انسانی مشخص با سایر توالیهای ژنوم انسانی متفاوت است را شناسایی می کنند. این تفاوتهای ژنومی در اندازههای مختلفی هستند. این تفاوت ممکن است به کوچکی یک حرف DNA (به نام پلی مورفیسم تکنوکلئوتیدی)، حروف طولانی (به نام انواع ساختاری) مانند Insertions and Deletions، یا ناهنجاریهای کروموزومی خیلی بزرگتر باشد.
این تفاوتهای ژنومی ممکن است هیچ خطری برای سلامتی فرد نداشته باشند، یا میتوانند مستقیماً باعث اختلالات نادر ارثی، سرطان یا دیگر بیماریهای شایعتر شوند.
محققان چنین حجم بالایی از داده های ژنومی را چگونه مدیریت و ذخیره می کنند؟
متخصصان فنآوری کامپیوتر و ژنومیک با استفاده از سیستمها و نرم افزارهای مختلف کامپیوتری، دادههای ژنومی را مدیریت و ذخیره میکنند. مراکز تحلیل و هماهنگی دادهها که در حال افزایش هستند بخشی از این شبکههای تحقیقاتی هستند و این خدمات را ارائه میدهند.
تولید دادههای ژنومی نیاز به حمایت مالی زیادی از طرف موسسات دارد مانند مؤسسه ملی تحقیقات ژنوم انسانی (NHGRI: مخفف National Human Genome Research Institute) که هر ساله بیش از ۱۲۵ میلیون دلار برای حمایت از تلاشهای مختلف علم دادههای ژنومی در نظر میگیرد.
دادههای تولیدشده اغلب بهصورت گسترده در دسترس جامعه علمی قرار می گیرند تا تجزیه و تحلیل بیشتر دادهها را تسهیل کنند. آنها انواع مختلفی از اطلاعات درمورد ژنوم انسان را سازماندهی میکنند و ارائه میدهند، مانند مکان ژنها و گونههای مختلف در DNA.
بسیاری از پلتفرمهای ابری (cloud platforms) خصوصی و تجاری با همکاری نهادهای دولتی و عمومی، مانند مؤسسه ملی بهداشت (NIH) از طریق گروهی به نام STRIDES همکاری میکنند. این طرحها زیرساختهای ذخیرهسازی و محاسباتی و حفاظتهای امنیتی و حریم خصوصی لازم برای دادههای ژنومی را فراهم میکنند.
پیامدهای اخلاقی، قانونی و اجتماعی برای به اشتراک گذاری داده های ژنومی چیست؟
انجام تحقیقات ژنومیک مجموعهای از مسئولیتهای اخلاقی را نیز به همراه دارد، زیرا اطلاعات مربوط به توالی ژنوم یک فرد با مسائل پیچیده مربوط به حریم خصوصی و هویت مرتبط است.
- رضایت آگاهانه: محققان معمولاً از افرادی که ژنوم آنها توالییابی شده است، رضایت دریافت میکنند. اما آنها باید در فرآیند کسب رضایت، اطلاعات روشنی در مورد نحوه استفاده و به اشتراکگذاری دادههای توالی ژنوم ارائه دهند.
- حریم خصوصی: ابزارهای محاسباتی قدرتمند میتوانند دادههای توالی ژنومهای شناساییشده را بگیرند و تحت شرایط خاص، آنها را به فردی که DNA او توالییابی شده است، متصل کنند. بازرسان میتوانند از چنین ابزارهایی برای اهداف مفیدی مانند شناسایی مجرمانی که DNA را در صحنه جرم به جا گذاشتهاند، استفاده کنند. اما مزایای اجتماعی استفاده از دادههای ژنومی به این روش باید بر خطرات احتمالی آن بیشتر باشد.
- هوش مصنوعی (AI): ابزارهای هوش مصنوعی بهطور فزایندهای به محققان کمک میکند تا تعداد زیادی از دادههای توالی ژنوم را پردازش کرده تا الگوهای پنهان در DNA را کشف کنند. با این حال، از آنجایی که الگوریتمهای هوش مصنوعی اغلب فاقد شفافیت هستند، زمانی که چنین الگوریتمهایی روی دادههای DNA اعمال میشوند، سوگیریها ممکن است شناسایینشده باشند. این حوزه از علم داده ژنومی به تحقیقات اخلاقی گستردهای نیاز دارد تا تفاوتهای منحصربهفرد بین روشهای فعلی در علم دادههای ژنومی (که برای تفسیر نتایج به هوش انسانی تکیه میکنند) و روشهای جدیدتر هوش مصنوعی را بررسی کند. اگرچه روشهای هوش مصنوعی مزایای بسیار امیدوارکنندهای را ارائه میدهند، اما نسبت به انسانها به روشهای کاملاً متفاوتی نتیجهگیری میکنند، و از این رو باید تحت نظارت دقیق اخلاقی قرار گیرند.
Photo by Vitaly Vlasov from Pexels
با تمام این ملاحظات، دانشمندان داده و محققان ژنومیک باید درمورد پیامدهای مطالعات خود آموزش ببینند و از نزدیک با محققان حوزهی اخلاق همکاری کنند.
محققان چگونه داده های ژنومی انسان را به اشتراک می گذارند؟
انتظار میرود که محققان دادههای ژنومی انسان را بر اساس رضایت شرکتکنندگان در تحقیق به اشتراک بگذارند. دادههای ژنومی معمولاً از طریق منابع داده با جامعه علمی به اشتراک گذاشته میشوند که میتوان به سه روش به آنها دسترسی داشت:
انواع دسترسی به دادههای ژنومی:
- دسترسی آزاد یا دسترسی نامحدود گستردهترین شکل اشتراک داده است. دادهها برای هر هدف پژوهشی در دسترس عموم است.
- دسترسی ثبتشده بین دسترسی باز و دسترسی کنترل شده قرار میگیرد. در این حالت محققان میتوانند دادهها را برای هر هدفی در دسترس داشته باشند به شرطی که اطلاعات خود را ثبت کنند و کار آنها با دادهها هم ممکن است نیاز به نظارت داشته باشد.
- دسترسی کنترلشده: در این حالت اشتراکگذاری دادههای مستلزم آن است که محققان هدف تحقیق خود را توصیف کنند تا یک کمیته دسترسی ویژه به دادهها، بتواند سازگاری هدف تحقیق را با رضایت شرکتکنندگان ارزیابی کند. محقق تنها پس از دریافت تایید کمیته میتواند به دادهها دسترسی داشته باشد.
موضوعات جدید و در حال ظهور در حوزه ی علم داده ژنومیک چیست؟
ژنوم انسان حاوی انواع ژنومی بسیاری است (حروف DNA که در مکانهای خاص در افراد متفاوت است). سیستمهای مراقبتهای بهداشتی و محققان در حال ساخت ابزارهایی هستند که این تفاوتهای DNA را شناسایی کرده و آنها را به اطلاعات مرتبط پزشکی، مانند خطر ابتلا به بیماری یا نشانهای برای یک داروی خاص مرتبط میسازد.
محققان همچنین با استفاده از اطلاعات ژنومی از سیستمهای هوش مصنوعی برای تفسیر دادههای ژنومی برای اهداف بالینی مانند تشخیص بیماریها در مراحل اولیه یا پیشبینی خطر بیماریهای مختلف استفاده میکنند.
در دهه گذشته، محاسبات ابری (Cloud computing) برای ذخیرهسازی و تجزیه و تحلیل دادههای ژنومی ضروری شده است. رایانش ابری نیاز به تکرار مجموعه دادههای بزرگ را کاهش و امنیت را افزایش میدهد و امکان دسترسی بیشتر محققان به دادههای ژنومی را فراهم میکند. دانشمندان داده در حال ایجاد ابزارهایی برای آسانتر کردن آپلود دادهها و تضمین حفظ حریم خصوصی هستند.
ترجمه اختصاصی توسط داروباکس
منابع:
National Human Genome Research Institute, Genetics vs. Genomics Fact Sheet, Last updated: September 7, 2018
National Human Genome Research Institute, Genomic Data Science, Last updated: April 5, 2022