В ходе проекта планируется записать голосовые сообщения, которыми обмениваются подростки в своей ежедневной коммуникации, и создать на их основе корпус, размеченный на фонетическом и морфологическом уровнях.
Задачи проекта:
1. Запись голосовых сообщений на определенные темы.
2. Перекодировка файлов при необходимости и загрузка в систему.
3. Аннотирование файлов при помощи структуры метаданных.
4. Транскрибирование данных в программе ELAN.
5. Автоматическая морфологическая разметка при помощи парсеров (MyStem, Pymorphy, Stanza).
6. Загрузка текстов в корпус-менеджер.