ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Суббота
20 июля
692684 Топик полностью
Ксения (12.08.2016 19:31, просмотров: 103) ответил AU08 на Скорее всего у Ксении всего одна запись огромной длины. Вопрос в том "как складывать / как считать результат". Ну СУБД легко и относительно быстро решается с использованием индекса для БД результата.
Исходные файлы - текстовые, в PDB-формате. В них ищут секцию SEQRES, где белок записан в виде последовательности аминокислот в трехбуквенном коде. Код переводится в порядковые номера 0-20. Потом из этой последовательности выбирают участки, двигаясь от одного конца к другому окном с шириной 7 (очень похоже производят цифровую фильтрацию в DSP). После чего все 7 цифр используют в качестве индекса 7-мерного массива, инкриментируя соответствующий этим координатам элемент. В конце всей этой работы в массиве накапливается статистика по ВСЕМ последовательностям длиной 7.