
آنالیز دادههای NGS | دادههای توالییابی کل ژنوم (WGS)
در دوره تخصصی آنالیز دادههای NGS | دادههای توالییابی کل ژنوم (WGS)، به بررسی عمیق دادههای توالییابی نسل جدید (NGS) و تحلیل کل ژنوم (WGS) میپردازید. از آشنایی با تکنولوژیهای Omics و دانلود دادهها از پایگاههایی مانند SRA آغاز کرده و با پلتفرم Galaxy، مراحل مختلف پردازش، ارزیابی و تحلیل دادهها را یاد میگیرید. شما با ابزارهایی مانند FASTQC و MultiQC برای بررسی کیفیت، و SAMtools برای پردازش دادههای توالییابیشده کار خواهید کرد. همچنین مفاهیم پیشرفتهتری چون SNP calling، انواع Assembly و کار با فرمتهای VCF و BAM را نیز خواهید آموخت. در پایان، توانایی انجام پروژههای واقعی NGS و طراحی Workflow در Galaxy را به دست خواهید آورد.
3.850.000 تومان قیمت اصلی 3.850.000 تومان بود.1.890.000 تومانقیمت فعلی 1.890.000 تومان است.
توضیحات
NGS چیست؟
توالییابی نسل جدید (Next-Generation Sequencing) یا NGS یک فناوری پیشرفته است که امکان توالییابی سریع و دقیق DNA و RNA را فراهم میکند. این تکنولوژی به دانشمندان این توانایی را میدهد که میلیونها توالی ژنتیکی را بهطور همزمان مطالعه کنند. در مقایسه با روشهای سنتی مانند روش سنگر، NGS حجم بالاتری از دادهها را با سرعت بیشتر و هزینه کمتر تولید میکند. فرآیند NGS شامل مراحل مختلفی است، از آمادهسازی نمونه و تولید توالیها تا تحلیل دادههای بهدستآمده. یکی از مهمترین مراحل این فناوری، آنالیز دادههای خام است که بهدستآمدن اطلاعات ارزشمند بیولوژیکی و بالینی را امکانپذیر میسازد.
اهمیت آنالیز دادههای NGS چیست؟
اهمیت آنالیز دادههای NGS از این جهت است که حجم بالای دادهها نیاز به پردازش دقیق دارد. این دادهها میتوانند شامل میلیونها قطعه کوتاه از توالی باشند که بدون تحلیل مناسب، بیمعنی خواهند بود.
آنالیز این دادهها به شناسایی جهشها و تغییرات ژنتیکی مرتبط با بیماریها کمک میکند. همچنین، با استفاده از تحلیل دقیق، میتوان ساختارهای پیچیده ژنومی را تفسیر کرد و به شناسایی تغییرات ساختاری مهم دست یافت. یکی از کاربردهای کلیدی NGS در حوزه پزشکی شخصی و درمانهای فردمحور است، جایی که اطلاعات ژنتیکی هر فرد برای انتخاب درمان مناسب مورد استفاده قرار میگیرد. بهطور خلاصه، آنالیز دادههای NGS جزء ضروری برای استخراج اطلاعات مفید از این فناوری قدرتمند است و بدون آن نمیتوان از مزایای کامل این تکنولوژی بهرهمند شد.
WGS | اهمیت و کاربرد
توالییابی کل ژنوم (Whole Genome Sequencing) یا WGS یک روش جامع و پیشرفته برای تعیین توالی کل DNA در ژنوم یک ارگانیسم است، که تمام بخشهای ژنومی را با دقت بالا توالییابی میکند.
این فرآیند از استخراج DNA و برش دادن آن به قطعات کوچک آغاز میشود، سپس هر قطعه بهطور جداگانه توسط دستگاههای توالییابی خوانده میشود و در نهایت با هم ترکیب میشوند تا ژنوم کامل را بازسازی کنند. مراحل اصلی شامل سرهمبندی توالیها، کنترل کیفیت و شناسایی واریانتها است، که اطلاعات ژنتیکی دقیقی از نمونه فراهم میکند.
WGS کاربردهای گستردهای دارد؛ از تحقیقات پزشکی و شناسایی تغییرات ژنتیکی در بیماریها، تا مطالعه تکامل جمعیتها، اصلاح گونههای زراعی و دام، و تشخیص پاتوژنهای میکروبی. این روش در مقایسه با روشهای توالییابی محدودتر، جامعیت بیشتری دارد و قادر به شناسایی انواع واریانتها از تغییرات تکنوکلئوتیدی (SNP) تا تغییرات ساختاری بزرگ است. بهدلیل دقت و جزئیات بالای اطلاعات ارائهشده، WGS در حال حاضر یکی از ابزارهای اصلی برای بررسی دقیق و تفسیر ژنومها در زیستشناسی و پزشکی محسوب میشود.
چه مهارتهایی را میآموزم؟
در دوره جامع آنالیز دادههای NGS | دادههای توالییابی کل ژنوم (WGS)، بیولوژیستها به شکلی کاملاً عملی و هدفمند با مفاهیم مراحل تحلیل دادهها و همچنین با روندهای کاری در آنالیز دادههای نسل جدید توالییابی (NGS) آشنا خواهند شد.
این دوره، بدون نیاز به پیشزمینه برنامهنویسی یا بیوانفورماتیک طراحی شده و به طور کامل بر روی آموزش کاربردی و بدون پیچیدگیهای اضافی تمرکز دارد.
در مراحل اولیه، شما با اصول NGS، پایگاههای داده مهم مانند SRA، پلتفرم گالکسی (Galaxy) و انواع فرمتهای داده مورد استفاده در این نوع آنالیز آشنا خواهید شد. این مباحث به شما کمک میکنند تا دادههای مورد نظر را بهطور اصولی وارد محیط تحلیل Galaxy کنید و برای مراحل بعدی آماده شوید. سپس در هر مرحله اصلی از آنالیز (کیفیتسنجی، مپینگ، شناسایی واریانتها و اسمبلی) ابزارهای کاربردی مورد نیاز را یاد خواهید گرفت و نحوه اجرای آنها و تحلیل نتایج را به دقت فرا خواهید گرفت. در این مراحل، الگوریتمهای کلیدی به سادهترین شکل ممکن معرفی شدهاند تا درکی کامل از فرایند داشته باشید، بدون آنکه نیاز به یادگیری فرمولهای پیچیده باشد.
این دوره شامل تمرینات پروژهمحور است و در هر بخش، شما روی یک مجموعهداده کوچک به عنوان نمایی از پروژه نهایی کار میکنید. در فصلهای پیشرفتهتر، نحوه طراحی و اجرای گردشکار (Workflow) و همچنین بازآفرینی آن در Galaxy آموزش داده میشود. در پایان دوره، شما بهصورت عملی و قدم به قدم روی دادههای واقعی NGS کار خواهید کرد و یک پروژه جامع را که شامل دادههای ویروسی از پایگاه SRA است، به اتمام میرسانید.
این دوره به نحوی طراحی شده که برای تمامی سطوح علمی، از مبتدی تا پیشرفته، مفید باشد و مهارتهای کاربردی و تخصصی لازم را به شما میآموزد تا در پایان به تحلیلگری ماهر در زمینه دادههای NGS تبدیل شوید.
دورهای با بالاترین استاندارهای علمی و آموزشی مبتنی بر بیش از 15 سال تجربه آموزش و پژوهش در ایران و اروپا
جلسات دوره
مدرسان دوره

تیم علمی آکادمی قاصدک
نظرات
سوالات و نظراتتون رو با ما به اشتراک بذارید
برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید. صفحه ورود و ثبت نام
محصولات مرتبط

سلام وقت به خیر، ممنونم از دوره فوق العاده تون
من سوال دارم و اینه که در فصل ۸ فرمودید یک فایل براتون بارگذاری کردم ولی فایل برای من موجود نیست.
درود بر شما
لطفا تیکت ارسال نمایید.
پیروز باشید
درود بر شما
ممنون از خانم فرهنگی عزیز بابت توضیحات دقیق
یک سوال از فصل ۲۸ مربوط به پروژه داشتم:
۱- با توجه به فرایند کاملا مشابه من با آموزش داده شده طول بلند ترین کانتیگ بجای ۹۶۳۱ متفاوت با نتیجه دریافت شده ۷۶۶۵ هست که من احتمال میدم به دلیل تغییر ورژن spades می باشد. آیا این استدلال درست است؟
۲- چطور فرمت بلند ترین کانتیگ ذخیره شده توسط شما به فرمت fasta و fai تغییر پیدا کرد در صورتی که بصورت روتین TextEdit اینکار و انجام نمیده و چطور این فایل توسط bwa_mem2 شناسایی شد!؟ البته حتما فرمت را تغییر داد ولی در آموزش نشان داده نشده!؟
با اینکه مشکل رو بر طرف کردم اما با چالش مواجه شدم چون وقتی در گلکسی فرمت را تغییر میدهیم توضیحاتی را به فایل اضافه می کند که موجب ایجاد مشکل در IGV می شود .
ممنون می شم راهنمایی بفرمایید
با تشکر
درود بر شما
لطفا تیکت ارسال نمایید.
پیروز باشید
با سلام و وقت بخیر؛
اول ممنون بابت دوره هاتون خصوصا دوره ngs که بسیار با جزئیات و با حوصله ارائه شده و برای منی که صفر هستم در این زمینه عالی بود.
سوال: در خصوص تمرین جلسه پنجم SRA database در قسمت Data access دو فایل fastq با دو سایز متفاوت وجود داره هدف ما کدوم هست؟(کلا میخوام بدونم چون میدونم که در قسمت بعدی میتونیم دانلودش کنیم).
سوال دوم اینکه با توجه به اینکه فرمت SRA حالت خام داره چطوری باید فایل sra را به fastq تبدیل کرد آیا نیازه ما بلد باشیم این مورد را؟
سوال آخر: برای تمرین مذکور باید FASTQ را دانلود کنیم با توجه به حجم ۵۰۰ مگابایتی یا اگر لینک داره چطوری لینکشو پیدا کنیم که بعدا در گلکسی آپلود کنیم؟
درود بر شما
خیلی خوشحالیم که دوره NGS براتون مفید بوده! 😊
سوال اول: کدام فایل FASTQ را انتخاب کنیم؟در SRA database، معمولاً دو نسخه از فایلهای FASTQ ارائه میشود. یک نسخه کامل (Full dataset) که شامل تمام دادههای خوانششده است. یک نسخه کوچکتر (Lite or Subset dataset) که برای تست و آموزش استفاده میشود. در تمرین جلسه پنجم، اگر هدف فقط تمرین کردن باشد و محدودیت حجم داریم، نسخه کوچکتر را انتخاب میکنیم. اما اگر هدف تحلیل داده واقعی باشد، بهتر است نسخه کامل را دریافت کنیم.
سوال دوم: تبدیل SRA به FASTQ: فایلهای با فرمت .sra دادههای خام تعیین توالی هستند که توسط NCBI ذخیره میشوند. برای تبدیل آنها به FASTQ، ابزار fastq-dump از مجموعه SRA Toolkit استفاده میشود.
دستور کلی برای این تبدیل به این شکل است:
fastq-dump –split-files sample.sra
در اکثر پروژههای عملی، دادهها را مستقیماً بهصورت FASTQ دریافت میکنیم و نیازی به تبدیل نیست. اما دانستن این روش برای زمانی که فقط به فایل .sra دسترسی دارید، مفید خواهد بود.
سوال سوم: دانلود فایل FASTQ یا دریافت لینک برای Galaxy.
در SRA database، شما میتوانید به دو روش دادهها را دریافت کنید.دانلود مستقیم: اگر فضای کافی دارید، فایل FASTQ را دانلود کرده و سپس در Galaxy آپلود کنید. استفاده از لینک SRA: در صفحهی دادهی موردنظر، معمولاً لینکی برای دانلود از طریق FTP یا Aspera وجود دارد. این لینک را میتوانید در قسمت Upload Data در Galaxy وارد کنید تا فایل مستقیماً در فضای Galaxy ذخیره شود.
برای پیدا کردن لینک دانلود، به صفحه داده در NCBI SRA بروید، به قسمت Run Browser بروید، روی Send to کلیک کنید و گزینه File یا Run Selector را انتخاب کنید، لینک FASTQ را کپی کرده و در Galaxy استفاده کنید.
پیروز باشید
سلام و عرض ادب
بنده دوتا سوال داشتم
در جلسه یازدهم ، با توجه به اینکه suffix array بعد از sort شدن بر مبنای حروف الفبا ، به صورت [ ۴،۱،۳،۰،۲ ] در اومد، پس چرا ترتیب bwt sequence شد CG$AT مگه نباید میشد CGT$A
سوال دوم در مورد نحوه ی دستیابی و انتقال فایل رفرنس جینوم ref_seq_test.fasta به هیستوری هست.
ممنونم از زحماتتون.
درود بر شما
پرسش اول: ترتیب Burrows-Wheeler Transform (BWT) از روی Suffix Array (SA) به این شکل تعیین میشود که هر موقعیت از SA را در نظر میگیریم، و کاراکتر قبل از آن را در متن اصلی میخوانیم (یا $ برای ابتدای رشته). فرض کنید رشته اصلی TACG$ باشد:
Suffixes و SA:
۴ -> $
۱ -> ACG$
۳ -> G$
۰ -> TACG$
۲ -> CG$
پس SA = [4, 1, 3, 0, 2]
BWT Sequence را از SA میسازیم:
SA[0] = 4 → قبلش G هست.
SA[1] = 1 → قبلش C هست.
SA[2] = 3 → قبلش T هست.
SA[3] = 0 → قبلش $ هست.
SA[4] = 2 → قبلش A هست.
BWT = G C T $ A
اما شما نوشتید که در ویدیو CG$AT آمده که با این روش متفاوت است. احتمالاً ترتیب SA در ویدیو بر اساس ایندکس صفر یا روش دیگری تولید شده، یا اینکه متن اصلی را اشتباه در نظر گرفتهاید. پیشنهاد میکنیم یک بار خروجی دقیق را روی کاغذ بررسی کنید.
پرسش دوم:
برای افزودن فایل ref_seq_test.fasta به History در Galaxy، این روشها را میتوانید امتحان کنید:
✅ روش اول (آپلود دستی)
در Galaxy وارد Upload Data شوید.
گزینه Choose Local File را بزنید.
فایل ref_seq_test.fasta را انتخاب کنید.
روی Start کلیک کنید و منتظر بمانید تا فایل به هیستوری اضافه شود.
✅ روش دوم (دسترسی از دادههای عمومی Galaxy)
در قسمت Get Data گزینه Upload File from your Computer یا Data Libraries را بررسی کنید.
ممکن است این فایل در یکی از دیتابیسهای عمومی Galaxy باشد.
✅ روش سوم (URL یا FTP اگر فایل روی سرور دیگری هست)
اگر فایل در سرور یا مخزن خاصی (مثلاً NCBI) قرار دارد، میتوانید URL آن را در Upload Data وارد کنید تا مستقیماً از سرور دانلود شود.
پیروز باشید
با سلام
خیلی دوره کامل و عالی بود. تدریس خانم دکتر واقعا بی نقص و عالی بود. هم بسیار جامع همه مطالب مورد نیاز رو پوشش داند و در مورد الگوریتم برنامه ها توضیح دادند که به درک بهتر و استفاده پیشرفته تر کمک می کنه و هم اینکه بسیار شیوا و قابل فهم تدریس کردند. بسیار ممنونم
فقط اینکه من یک پیشنهادی داشتم که اگر صلاح دونستید می تونید بررسی کنید. اینکه اگر امکانش بود می تونید چند جلسه در مورد …
درود بر شما
خیلی خوشحال شدیم که از دوره رضایت داشتید و تدریس خانم دکتر رو بینقص و جامع توصیف کردید. نظرات شما واقعاً باعث دلگرمی و انگیزه تیم ما میشه. 🙏
باز هم سپاس که وقت گذاشتید و نظرتون رو با ما به اشتراک گذاشتید. 🌟
با سلام و عرض احترام
این دو دوره آموزشی تان چه شباهت و تفاوت هایی دارند؟
۱) آموزش آنالیز دادههای RNA-Seq: از پایه تا پیشرفته
https://dandelionacademia.com/product/rna-seq-analysis/
۲) آنالیز دادههای NGS | دادههای توالییابی کل ژنوم (WGS)
https://dandelionacademia.com/product/ngs_analysis/#reviews
دوره اول به مدت ۲۳ ساعت می باشد و دوره دوم به مدت ۱۱ ساعت می باشد. آیا با خریدن دوره ی اول از دوره دوم بی نیاز می شویم؟
با تشکر
سلام و عرض ادب،
هر دو دوره آموزش آنالیز دادههای RNA-Seq و آنالیز دادههای NGS | توالییابی کل ژنوم (WGS) به تحلیل دادههای نسل جدید توالییابی (NGS) میپردازند اما کاربرد و تمرکز متفاوتی دارند. دوره RNA-Seq (23 ساعت) جامعتر است (آنالیز در محیطهای ویندوز و لینوکس، با کدنویسی و بدون نیاز به کدنویسی ) و بر تحلیل بیان ژنها، آنالیز DGEs و ترانسکریپتومیکس تمرکز دارد، در حالی که دوره NGS/WGS (11 ساعت) به دادههای ژنوم کامل، مونتاژ ژنوم و شناسایی واریانتها اختصاص دارد و آموزش بدون نیاز به کدنویسی ارایه می شود. اگر پروژههای شما در حوزه بیان ژنی یا ترانسکریپتومیکس است، دوره RNA-Seq مناسبتر است. اما برای تحلیل ژنوم کامل یا شناسایی واریانتها، دوره NGS/WGS کاربردیتر خواهد بود. این دو دوره مکمل یکدیگرند و خرید دوره RNA-Seq بهتنهایی نمیتواند تمام نیازهای مربوط به دادههای WGS را پوشش دهد. این دو دوره توسط دو استاد مجرب با مدرک PhD که در کانادا و اروپا مشغول پژوهش هستند و پیشتر هیئت علمی دانشگاههای معتبر ایران بودهاند، ارائه میشود. هر دو دوره مکمل یکدیگرند اما از هم مستقل نیز هستند.
Mamnun az doreye khubetun
Mishe rahnemayee befarmayin ke chetor mishe SNP ro bar ruye gene ha jodagane visualize bokonim?
ke gene mutation ha ro beshe barresi kard.
Aya baraye in kar tools khasi dar galaxy hast?
Mamnunam
درود بر شما
از لطف شما سپاسگزاریم.
برای این منظور باید اسنیپها (SNPs) انوتیت (annotate) بشن که در درس توضیح داده شده و چون coordinate هر کدوم از ژنها مشخص هست ما می تونیم اینکار رو انجام بدیم و بفهمیم که SNPها مربوط به چه ناحیه ژنی هستند. اگر فایل کوچک باشه میشه این SNPها را جدا کرد و به جای اینکه فایل کامل رو ببریم و در IGV مشاهده کنیم میشه این فایل رو که در واقع فیلتر شده به IGV ببریم و مشاهده کنیم. اگر فایل بزرگ باشه با bcfTools میشه این کار رو انجام داد.
پیروز باشید
سلام ،
خیلی ممنونم از دوره خوبتون.
من هر چقدر تلاش میکنم نمیتونم به فایل زیلا وصل بشم. اطلاعات هم درست وارد میکنم اما باز نمیشه لطفا راهنماییم کنید.
درود بر شما
چنانچه مشکل ادامه دار هست، پیشنهاد این است که از ابتدا اکانت کاربری خود را در گلکسی اروپا بسازید (usegalaxy.eu). ما به این مطلب در دوره RNA-Seq هم اشاره کردیم که ممکن است برای انتقال داده به سرور اصلی گلکسی یعنی usegalaxy.org محدودیت های وجود داشته باشد.
پیروز باشید
درود دوباره ،
بله طبق توصیه تون در دوره هردو گلکسی امتحان کردم اما با این اررو مواجه میشم.
.Command: PASS ********
Response: ۵۳۰ Login incorrect.
Error: Critical error: Could not connect to server
در صورتی که قبلا از فایل زیلا برای هدف دیگری استفاده نمودم مشکلی نبوده .
با تشکر از توضیحات شما درباره مشکل اتصال به FTP گلکسی با استفاده از FileZilla.
به نظر میرسد که مشکل همچنان ادامه دارد: ابتدا، اطمینان حاصل کنید که نام کاربری و رمز عبور را دقیقاً همانطور که در حساب Galaxy ثبت کردهاید وارد میکنید و به حروف بزرگ و کوچک توجه دارید. سپس، تنظیمات FTP در FileZilla را بررسی کنید: میزبان را http://ftp.usegalaxy.eu (برای Galaxy اروپا)، پورت را ۲۱، نوع اتصال را FTP و حالت ورود را Normal تنظیم کنید. موقتاً فایروال و آنتیویروس سیستم خود را غیرفعال کنید تا مطمئن شوید مانع اتصال نمیشوند. در FileZilla، حالت Passive را فعال کنید و از اتصال پایدار اینترنت خود اطمینان حاصل کنید. اگر از VPN استفاده میکنید، آن را موقتاً غیرفعال کنید. همچنین، میتوانید از یک نرمافزار FTP دیگر مانند WinSCP یا Cyberduck استفاده کنید تا مطمئن شوید مشکل مربوط به FileZilla نیست. گاهی سرورها محدودیتهایی برای IPهای خاص اعمال میکنند، پس با پشتیبانی Galaxy تماس بگیرید تا مطمئن شوید IP شما مسدود نشده است. مطمئن شوید که از آخرین نسخه FileZilla استفاده میکنید و در نهایت، اگر همه این موارد را امتحان کردید و همچنان مشکل دارید، با پشتیبانی Galaxy تماس بگیرید و جزئیات مشکل را شرح دهید. امیدوارم یکی از این راهحلها به شما کمک کند.
سلام وقت بخیر.
منم این مشکل رو داشتم و بعد رفع شد; در قسمت نام کاربری لطفh ادرس ایمیلی که باهاش ثبتنام کردید رو وارد کنید ببینید مشکل برطرف نمیشه.
سلام
خیلی دوره بی نظیری بود. سپاس از تیم شما.
درود بر شما
از رضایت شما خرسندیم.
سلام وقت بخیر
با تشکر از دوره عالی WGS و تدریس فوق العاده خانم دکتر
فقط من ویدئوی جلسه بیست و هشت رو ندارم
درود بر شما
خوشحالیم که دوره برای شما مفید بوده.
فصل بیست و هشت هم در دسترس می باشد.