О проекте
Revisorium вырос из личного интереса к тому, что можно увидеть в открытых данных, если собрать их не как отдельные документы, а как связанную картину.
Зачем это сделано
Декларации, должности, партии, государственные учреждения и публичные связи уже доступны в разных источниках. Но чаще всего они разрознены: один PDF здесь, другая таблица там, часть контекста в реестрах или на сайтах учреждений. Из-за этого даже простые вопросы требуют много ручной работы.
Мне было интересно проверить, что получится, если соединить открытые данные с автоматическим анализом: извлечь из деклараций цифры, разложить их по годам, построить графики и посмотреть, где появляются резкие изменения, повторяющиеся связи или вопросы для дополнительной проверки.
Что показывает Revisorium
Сайт показывает динамику доходов, декларации, публичные роли, группы и связи между людьми, партиями и учреждениями. Главная задача — дать более наглядную структуру для самостоятельного анализа.
Такой формат помогает быстрее увидеть, какие декларации стоит открыть вручную, где данные требуют уточнения и какие связи или назначения заслуживают отдельного внимания.
Ограничения
Часть обработки выполняется автоматически: PDF-декларации распознаются, суммы извлекаются из текста, а строки сопоставляются по именам и источникам. Поэтому возможны ошибки распознавания, неполные совпадения и неточные суммы, в том числе занижение итогов из-за нераспознанных строк.
Исходные документы и ссылки на источники остаются важной частью проекта. Если в данных видна странность, правильный следующий шаг — открыть оригинальную декларацию и проверить ее вручную.
Личная мотивация
Это личный гражданский проект, выросший из попытки обычного человека разобраться в публичных данных и сделать их более понятными для чтения, сравнения и проверки.
Если данные уже открыты обществу, у общества должен быть удобный способ их смотреть не только как архив документов, но и как динамику, связи и вопросы для внимательного анализа.