Вопрос в наличии видеокарты Nvidia с VRAM более 8Gb. На Core i3
запись сессии 45 мин транскрибируется за 1 ночь. Настолько низкая
производительность связана с тем что реальный разговор (не
студийный дикторский текст) с удовлетворительным качеством
распознают исключительно модели максимального размера а они пипец
как медленные. Работающей диаризации (маркировка собеседников) я
еще не видел хотя номинально есть. Карты Nvidia безальтернативны
для любых нейросетей потому что 99 .9% софта заточено на Cuda и в софте у NV фора лет в 15.