Your browser doesn't support the features required by impress.js, so you are presented with a simplified version of this presentation.
For the best experience please use the latest Chrome, Safari or Firefox browser.
Обработка данных секвенирования Sanger
Исполнители: Дмитрий Мелешко, Татьяна Малыгина
Руководитель: Павел Яковлев (BIOCAD)
Задачи:
- Сборка контигов по референсу
- Сборка контигов по GenBank карте плазмиды
- Сборка контигов по известным праймерам
- Поиск лидерных последовательностей исследуемых генов
- Получение нуклеотидных и аминокислотных последовательностей исследуемых генов
- (*) Исправление полученных последовательностей
- (*) Кластеризация полученных последовательностей
Необходимость решения, ожидаемые результаты
План:
1. На входе - набор ридов
2. Автоматизированная обработка (с минимизацией количества применяемых инструментов и средств)
3. ???
4. PROFIT!!!
Чему должны научиться:
- Разбираться в биологических форматах данных
- Читать хроматограммы и находить ошибки
- Собирать геномы
- Искать точные и неточные вхождения
Текущие результаты
- Используемые технологии - C++, ruby
- ABIF (научились обрабатывать неспецифичные данные анализатора ABI Prism 3130xl, при обработке руководствовались общей спецификацией формата)
- Познакомились с алгоритмом Смита-Уотермана (Smith-Waterman), научились выравнивать последовательности при различных условиях
- Bioruby (Bio::SangerChromatogram, Bio::Abif)
Спасибо за внимание!