ارتباط با زمینه های دیگر ویرایش ]

Bioinformatics یک حوزه علمی است که شبیه به محاسبات بیولوژیکی است اما با آن متمایز است ، در حالی که غالباً مترادف زیست شناسی محاسباتی محسوب می شود . محاسبات زیست شناختی برای ساخت رایانه های بیولوژیکی از مهندسی زیستی و زیست شناسی استفاده می کند ، در حالی که زیست فناوری اطلاعات از محاسبات برای درک بهتر زیست شناسی استفاده می کند. بیوانفورماتیک و زیست شناسی محاسباتی شامل تجزیه و تحلیل داده های بیولوژیکی ، به ویژه DNA ، RNA و توالی پروتئین است. حوزه بیوانفورماتیک رشد انفجاری را از اواسط دهه 1990 تجربه کرد ، که عمدتاً توسط پروژه ژنوم انسانی و پیشرفت های سریع در فناوری توالی DNA انجام می شود.

تجزیه و تحلیل داده های بیولوژیکی به تولید اطلاعات معنی دار شامل نوشتن و اجرای برنامه های نرم افزاری است که با استفاده از الگوریتم های از نظریه گراف ، هوش مصنوعی ، محاسبات نرم ، داده کاوی ، پردازش تصویر و شبیه سازی کامپیوتری . الگوریتم ها به نوبه خود به مبانی نظری مانند ریاضیات گسسته ، نظریه کنترل ، نظریه سیستم ، نظریه اطلاعات و آمار بستگی دارند .

تجزیه و تحلیل توالی ویرایش ]

مقالات اصلی: تراز توالی ، پایگاه داده توالی و تجزیه و تحلیل توالی بدون تراز

از آنجا که فاژ Φ-X174 شد توالی در سال 1977، [19] توالی DNA هزار نفر از ارگانیسم ها رمزگشایی شده و ذخیره شده در پایگاه داده ها. این اطلاعات دنباله ای برای تعیین ژنهایی که رمزگذاری پروتئین ها ، ژن های RNA ، توالی های نظارتی ، نقوش ساختاری و توالی های تکراری انجام می شود. مقایسه ژنهای موجود در یک گونه یا بین گونه های مختلف می تواند شباهت هایی بین عملکرد پروتئین یا روابط بین گونه ها نشان دهد (استفاده از سیستماتیک های مولکولی برای ساختن درختان فیلوژنتیک ). با افزایش تعداد داده ها ، مدتها پیش تجزیه و تحلیل توالی DNA به صورت دستی غیر عملی شد. برنامه های رایانه ایمانند BLAST بطور معمول برای جستجوی توالی ها - از سال 2008 ، از بیش از 260،000 جاندار ، حاوی بیش از 190 میلیارد نوکلئوتید استفاده می شود . [20]

توالی DNA ویرایش ]

مقاله اصلی: توالی DNA

قبل از تجزیه و تحلیل توالی آنها باید از بانک اطلاعات ذخیره سازی داده ها به عنوان مثال Genbank حاصل شود. توالی DNA هنوز یک مشکل غیر مهم است زیرا داده های خام ممکن است توسط سیگنال های ضعیف و پر سروصدا باشند. الگوریتم های پایه ای برای فراخوانی رویکردهای مختلف تجربی برای توالی DNA توسعه یافته اند .

مونتاژ توالی ویرایش ]

مقاله اصلی: مونتاژ توالی

اکثر تکنیک های تعیین توالی DNA قطعات کمی از توالی را تولید می کنند که برای بدست آوردن ژن کامل یا توالی ژنوم نیاز به جمع آوری دارند. به اصطلاح روش تعیین توالی تفنگ ساچمه ای (که به عنوان مثال توسط انستیتوی تحقیقات ژنومی (TIGR) برای ترتیب دادن اولین ژنوم باکتریایی ، Haemophilus آنفلوانزا استفاده شده است ) [21]توالی هزاران قطعه کوچک از DNA (از 35 تا 900 نوکلئوتید طولانی ، بسته به تکنولوژی توالی) ایجاد می کند. انتهای این قطعات با هم همپوشانی دارند و وقتی به طور صحیح توسط یک برنامه مونتاژ ژنوم تنظیم شوند ، می توان برای بازسازی ژنوم کامل استفاده کرد. ترتیب توالی تفنگ به سرعت داده توالی را به دست می دهد ، اما کار جمع آوری قطعات می تواند برای ژنوم های بزرگتر کاملاً پیچیده باشد. برای یک ژنوم به بزرگی ژنوم انسان ، ممکن است روزهای زیادی از زمان CPU روی کامپیوترهای با حافظه بزرگ و چند پردازنده برای جمع آوری قطعات انجام شود و مونتاژ حاصل معمولاً حاوی شکافهای بیشماری است که بعداً باید پر شود. توالی تفنگ ساچمهای روش انتخابی برای تقریبا همه ژنوم توالی امروز است [ که؟ ]، و الگوریتم های مونتاژ ژنوم یک منطقه مهم در تحقیقات بیوانفورماتیک است.

همچنین ببینید: تجزیه و تحلیل توالی ، معدن دنباله ، دنباله ابزار پروفایل ، و موتیف توالی

حاشیه نویسی ژنوم ویرایش ]

مقاله اصلی: پیش بینی ژن

در زمینه ژنتیک ، حاشیه نویسی فرایند مارک کردن ژنها و سایر خصوصیات بیولوژیکی در یک توالی DNA است. این فرایند باید به صورت خودکار انجام شود زیرا بیشتر ژنوم ها برای حاشیه نویسی با دست خیلی بزرگ هستند ، به این ترتیب میل به حاشیه نویسی هر چه بیشتر ژنوم را ذکر نمی کند ، زیرا سرعت تعیین توالی متوقف شده است تا یک تنگناها داشته باشد. حاشیه نویسی با این واقعیت امکان پذیر است که ژن ها دارای مناطق شروع و توقف قابل تشخیص هستند ، اگرچه توالی دقیق موجود در این مناطق می تواند بین ژن ها متفاوت باشد.

اولین توصیف یک سیستم جامع حاشیه نویسی ژنوم در سال 1995 [21] توسط تیم در موسسه تحقیقات ژنومی منتشر شد که اولین توالی و تجزیه و تحلیل کامل ژنوم یک ارگانیسم زنده آزاد ، باکتری Haemophilus آنفلوآنزا را انجام داد . [21] اوون وایت یک سیستم نرم افزاری را برای شناسایی ژن های رمزگذاری شده در کلیه پروتئین ها ، انتقال RNA ها ، RNA های ریبوزومی (و سایر سایت ها) طراحی و ساخته است. اکثر سیستم های حاشیه نویسی ژنوم فعلی به طور مشابه کار می کنند ، اما برنامه هایی که برای تجزیه و تحلیل DNA ژنومی وجود دارد ، مانند برنامه GeneMark که برای یافتن ژن های کد کننده پروتئین در Haemophilus influenzae آموزش و استفاده شده است.دائماً در حال تغییر و بهبود هستند.

پس از اهدافی که پروژه ژنوم انسان در سمت چپ پس از بسته شدن آن در سال 2003 برای رسیدن به، یک پروژه جدید توسعه یافته توسط موسسه ملی تحقیقات ژنوم انسانی در ایالات متحده ظاهر شد. پروژه به اصطلاح ENCODE مجموعه ای از داده های مشترک از عناصر کاربردی ژنوم انسانی است که از فناوری های بعدی توالی DNA و آرایه های کاشی ژنومی نسل بعدی استفاده می کند ، فناوری هایی که قادر به تولید بطور خودکار مقادیر زیادی از داده ها با یک کاهش به طور چشمگیر در هزینه های پایه هستند. اما با همان دقت (خطای تماس پایه) و وفاداری (خطای مونتاژ).

زیست شناسی تکاملی محاسباتی ویرایش ]

اطلاعات بیشتر: فیلوژنتیک محاسباتی

زیست شناسی تکاملی مطالعه مبدا و نزول گونه ها و همچنین تغییر آنها در طول زمان است. انفورماتیک با فعال کردن محققان به زیست شناسان تکاملی کمک کرده است:

  • تکامل تعداد زیادی از ارگانیسم ها را با اندازه گیری تغییرات در DNA آنها ، و نه تنها از طریق طبقه بندی بدنی یا مشاهدات فیزیولوژیکی ، دنبال کنید
  • مقایسه کل ژنوم ، که اجازه مطالعه رویدادهای تکاملی پیچیده تر، مانند تکثیر ژن ، انتقال افقی ژن ، و پیش بینی عوامل در باکتریایی مهم زایی ،
  • ساخت مدل های پیچیده ژنتیک جمعیت محاسباتی برای پیش بینی نتیجه سیستم با گذشت زمان [22]
  • پیگیری و به اشتراک گذاری اطلاعات در مورد تعداد فزاینده ای از گونه ها و موجودات زنده

تلاش های آینده تلاش می کند تا درخت پیچیده ترین زندگی را بازسازی کند .

حوزه تحقیقات در علوم رایانه ای که از الگوریتم های ژنتیکی استفاده می کند ، گاهی با زیست شناسی تکاملی محاسباتی اشتباه گرفته می شود ، اما این دو حوزه لزوماً مرتبط نیستند.

ژنومیک مقایسه ای ویرایش ]

مقاله اصلی: ژنومیک مقایسه ای

هسته اصلی تجزیه و تحلیل ژنوم ، ایجاد مکاتبات بین ژنها ( تجزیه و تحلیل ارتولوژی ) یا سایر ویژگیهای ژنومی موجودات مختلف است. این نقشه ها بین ژنتیکی است که باعث می شود ردیابی فرآیندهای تکاملی مسئول واگرایی دو ژنوم امکان پذیر باشد. بسیاری از وقایع تکاملی که در سطوح مختلف سازمانی فعالیت می کنند ، تکامل ژنوم را شکل می دهند. در پایین ترین سطح ، جهش نقطه ای بر نوکلئوتیدهای فردی تأثیر می گذارد. در سطح بالاتر ، بخشهای بزرگ کروموزومی تحت تکثیر ، انتقال جانبی ، وارونگی ، جابجایی ، حذف و درج قرار می گیرند. [23] در نهایت ، ژنوم های کامل در فرایندهای هیبریداسیون ، پلی پلوئید و آندوزیمبیوز نقش دارند.، اغلب منجر به زایمان سریع می شود. پیچیدگی تکامل ژنوم ، چالش های هیجان انگیز بسیاری را برای توسعه دهندگان مدل های ریاضی و الگوریتم ها ، که به طیفی از تکنیک های الگوریتمی ، آماری و ریاضی متوسل می شوند ، اعم از دقیق ، اکتشافی ، پارامتر ثابت و الگوریتم های تقریبی برای مشکلات مبتنی بر مدل های پارسیمونی تا مارکوف ، ایجاد می کند. الگوریتم های زنجیره ای مونت کارلو برای تجزیه و تحلیل بیزی از مشکلات بر اساس مدل های احتمالی.

بسیاری از این مطالعات مبتنی بر تشخیص همسانی توالی برای تعیین توالی به خانواده های پروتئین است . [24]

 

منبع

https://en.wikipedia.org/wiki/Bioinformatics