Датасет состоит из файла sample.csv и папок с дополнительными документами по классам. Они были взяты с сайта https://sudact.ru/, но также можно использовать любой другой открытый источник для расширения датасета.
Участникам хакатона предлагается, на основе входящего документа или его части, с применением технологий искусственного интеллекта, создать MVP в виде программного (программно-аппаратного) модуля определения типа документа с максимально возможной точностью.
Желаем удачи и не забывайте задавать вопросы на отраслевой сессии!