Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 

readme.md

Добро пожаловать на кейс от ООО "РЖД" - "Прием учетных документов"!


Структура датасета:

Датасет представляет из себя набор различных документов, обезличенных от ПДн. В частности, присутствует 3 папки:

  • альбомы форм - папка содержит НПА и примеры заполнения документов, с которыми участникам предстоит работать в рамках хакатона (М-11, ФМУ-76). Это образцы заполнения с объяснением и выведением критериев правильности заполнения. а также пустые формы.
  • М-11 - эта папка содержит примеры документа М-11, заполненные реальными людьми и обезличенные впоследствии
  • ФМУ-76 - эта папка содержит примеры документа ФМУ-76, заполненные реальными людьми и обезличенные впоследствии

Вашей задачей будет создание модели, которая сможет, анализируя заполненные электронные документы, оценить, насколько правильно они заполнены, а также предложить исправления. На основании документов имеет смысл построить базу данных предприятия (или ее имитацию), включающую в себя эти документы и позволяющую их отслеживать, сравнивать друг с другом, проверять перекрестные ссылки. Вы вправе создать примеры заполнения документов самостоятельно (как в корректном, так и в некорректном виде, для тестирования модели), основываясь на альбоме форм, представленном в датасете.

ВАЖНО

Обращаем ваше внимание, что вы вправе аугментировать и дополнять датасет, основываясь на примерах форм. Вашей задачей является не просто создание абстрактной модели определения ошибок, но создание комплексной системы, либо модуля, который будет иметь возможность интеграции с системами электронного документооборота РЖД. Ограничений практически нет, не бойтесь уточнять интересующие вас моменты на отраслевых сессиях у кейсодержателя!

ЖЕЛАЕМ УДАЧИ!

P.S. Не забудьте посетить экспертные сессии и не стесняйтесь задавать вопросы)