Как Microsoft Syntex автоматизирует работу с файлами в SharePoint
- Sarov+

- Jul 31
- 3 min read
Обработка документов в SharePoint с помощью искусственного интеллекта становится всё более актуальной задачей для организаций, работающих с большими объёмами файлов. Microsoft Syntex — одно из решений, которое позволяет автоматизировать извлечение данных из документов, сохранять их в колонках SharePoint и использовать в дальнейших автоматизациях через Power Automate. В этой статье мы поделимся опытом использования Syntex: расскажем, как он работает, сколько стоит, как создаются модели и на что стоит обратить внимание при его внедрении.
А узнать больше про Microsoft Syntex можно в нашем видео:
Как работает Microsoft Syntex
Syntex автоматически определяет типы документов, извлекает из них нужные данные и записывает эти данные в соответствующие поля SharePoint-библиотеки. После настройки его можно связать с Power Automate — и на основе распознанной информации выполнять автоматические действия: уведомления, создание задач и т.п.
Лицензии
Стоимость использования Syntex зависит от модели и количества обрабатываемых страниц:
Каждая транзакция — это одна страница документа.
Стоимость транзакции зависит от типа модели:
$0.01 за транзакцию (простая модель)
$0.05 за транзакцию (структурированная модель)
Если к одному документу применяются несколько моделей, цена умножается.
Например, 10-страничный документ с тремя активными моделями будет стоить не $0.10, а $0.30.
Виды моделей
В Syntex доступны два основных типа моделей:
Pre-built модели — шаблоны от Microsoft для типовых задач: работа с контрактами, инвойсами, счетами, извлечение конфиденциальной информации и др.
Custom модели — настраиваемые модели под уникальные сценарии. Особенно полезны для документов с повторяющейся структурой, например, счетов от конкретных поставщиков.
Важно: структурированные модели стоят в 5 раз дороже, чем pre-built.
Создание модели
Процесс начинается с нажатия Create Model. Вводятся базовые данные, указываются поля, которые необходимо извлекать:
Текстовые поля
Числовые поля
Даты
Подписи
Таблицы (с типами ячеек: текст, число, дата, чекбокс)
Интерфейс достаточно дружелюбен — даже клиент может сам настроить модель без помощи специалиста.
Информация для extract
В модели указываются нужные поля для извлечения. Это могут быть как простые поля, так и таблицы. Для таблиц Syntex умеет автоматически распознавать и подтягивать структуру без необходимости ручного ввода.
Коллекции
Коллекция — это набор документов с одинаковым layout, на основе которых будет обучаться модель.
Документы должны быть схожими по структуре (например, счета от одного вендора).
Если структура отличается — создается отдельная коллекция.
Важно добавлять разнообразные примеры: документы с таблицами, прерываниями, различиями в форматировании.
Выбор документов в коллекцию
Для обучения лучше выбирать все документы коллекции, но допускается частичное выделение. Главное — обеспечить качество и разнообразие примеров. Это влияет на точность извлечения данных.
Данные
После обучения можно протестировать модель. Syntex покажет:
Какие данные были распознаны
Уровень уверенности (confidence score) по каждому полю
Таблицы и значения, извлечённые из документа
Важно понимать, что цифры confidence score не всегда отражают фактическую точность на практике.
Тест
Для теста достаточно загрузить документ в SharePoint-библиотеку с привязанной моделью. Syntex автоматически определит тип документа и извлечёт нужные данные. Если тип не подходит ни под одну модель — контент будет оставлен без обработки.
Как работает модель
Каждая модель применяется ко всем документам библиотеки. После загрузки документ анализируется, и если модель находит соответствие — извлекает нужные поля. Результат виден во вьюшке SharePoint, отображающей поля модели.
Недостаток — нет гибкой настройки, какие документы обрабатывать, а какие — нет. Это значит, что даже неподходящие файлы могут быть просканированы (и засчитаны как транзакции), хоть и не будут распознаны.
Время операции
На практике распознавание происходит в среднем за 15–20 секунд. Иногда дольше. Явной нотификации о завершении нет — только визуально в SharePoint, по появлению данных в полях.
Можно настроить дополнительный Power Automate Flow, чтобы уведомлять пользователя о завершении обработки, например, по изменению статуса обработки документа на “finished”.
Как подключить Syntex
Чтобы начать работу с Microsoft Syntex:
Необходима подписка Azure (PSE Go).
Нужно настроить биллинг.
Отдельная лицензия на Syntex не требуется (по состоянию на сейчас), но оплата производится за транзакции.
Плюсы и минусы
Плюсы:
Глубокая интеграция с SharePoint
Удобный интерфейс для создания моделей
Возможность кастомизации без кода
Интеграция с Power Automate
Автоматизация рутинной работы с документами
Минусы:
Отсутствие out-of-the-box фильтрации по типу документов
Возможны ошибки при открытии моделей (например, “something went wrong”)
Отсутствие чёткой нотификации о завершении обработки
Высокая стоимость при больших объёмах документов и использовании нескольких моделей
Используется только в SharePoint (не подходит напрямую для CRM)
Заключение
Microsoft Syntex — мощное решение для автоматизации обработки документов в SharePoint. Однако, несмотря на потенциал, оно не всегда стабильно и требует вдумчивой настройки и расчёта затрат. Мы выбрали Syntex, потому что основной документооборот у клиента — в SharePoint, и решение органично вписалось в их процесс. Но прежде чем использовать Syntex, важно обсудить все детали с клиентом, чтобы стоимость и ограничения не стали неприятным сюрпризом.



Comments