Принцип детектирования порогово - амплитудный. (Ничтожное
напряжение на микрофоне усиливается и далее выступает как пороговое
открывающее). Входной каскад с достаточным к.у. можно построить на транзисторах с высокой β, (может быть с непосредственной связью или дарлингтона). Фича в том что транзисторы открываются только положительными полупериодами с микрофона. В режиме ожидания они постоянно закрыты и поэтому ток потребления очень мал. В 2021м можно применить ultra low power operational amplifier / nanopower op amp. Выход усилителя/opamp'а напрямую на будительную лапу µC... Если бы дело было в эпоху до µC, после 2-3 каскада поставил бы интегрирующую цепочку. Это бы дало возможность игнорировать просто громкие звуки (хлопки, крики, возгласы разговора), но среагировать на продолжительный сигнал пока он не зарядит конденсатор. Сразу построить такие вещи нельзя, они нуждаются в наладке/регулировке/настройке. Думается что хорошая настройка позволит сделать так что громкие звуки в целом игнорируются (но не все конечно), а вот несколько слов (фраза) сказанная вблизи воспринимается...
Для референса на всякую пожарку можно глянуть очень старую вещь (по памяти помню) Януш Войцеховский "Электронные Игрушки".