top of page
Search

Как Microsoft Syntex автоматизирует работу с файлами в SharePoint

  • Writer: Sarov+
    Sarov+
  • Jul 31
  • 3 min read

Обработка документов в SharePoint с помощью искусственного интеллекта становится всё более актуальной задачей для организаций, работающих с большими объёмами файлов. Microsoft Syntex — одно из решений, которое позволяет автоматизировать извлечение данных из документов, сохранять их в колонках SharePoint и использовать в дальнейших автоматизациях через Power Automate. В этой статье мы поделимся опытом использования Syntex: расскажем, как он работает, сколько стоит, как создаются модели и на что стоит обратить внимание при его внедрении.

 

А узнать больше про Microsoft Syntex можно в нашем видео:

 

Как работает Microsoft Syntex

 

Syntex автоматически определяет типы документов, извлекает из них нужные данные и записывает эти данные в соответствующие поля SharePoint-библиотеки. После настройки его можно связать с Power Automate — и на основе распознанной информации выполнять автоматические действия: уведомления, создание задач и т.п.

 

Лицензии

 

Стоимость использования Syntex зависит от модели и количества обрабатываемых страниц:

 

  • Каждая транзакция — это одна страница документа.

  • Стоимость транзакции зависит от типа модели:

    $0.01 за транзакцию (простая модель)

    $0.05 за транзакцию (структурированная модель)

  • Если к одному документу применяются несколько моделей, цена умножается.

 

Например, 10-страничный документ с тремя активными моделями будет стоить не $0.10, а $0.30.

 

Виды моделей

 

В Syntex доступны два основных типа моделей:

 

  • Pre-built модели — шаблоны от Microsoft для типовых задач: работа с контрактами, инвойсами, счетами, извлечение конфиденциальной информации и др.

  • Custom модели — настраиваемые модели под уникальные сценарии. Особенно полезны для документов с повторяющейся структурой, например, счетов от конкретных поставщиков.

 

Важно: структурированные модели стоят в 5 раз дороже, чем pre-built.

 

Создание модели

 

Процесс начинается с нажатия Create Model. Вводятся базовые данные, указываются поля, которые необходимо извлекать:

 

  1. Текстовые поля

  2. Числовые поля

  3. Даты

  4. Подписи

  5. Таблицы (с типами ячеек: текст, число, дата, чекбокс)

 

Интерфейс достаточно дружелюбен — даже клиент может сам настроить модель без помощи специалиста.

 

Информация для extract

 

В модели указываются нужные поля для извлечения. Это могут быть как простые поля, так и таблицы. Для таблиц Syntex умеет автоматически распознавать и подтягивать структуру без необходимости ручного ввода.

 

Коллекции

 

Коллекция — это набор документов с одинаковым layout, на основе которых будет обучаться модель.

 

  1. Документы должны быть схожими по структуре (например, счета от одного вендора).

  2. Если структура отличается — создается отдельная коллекция.

  3. Важно добавлять разнообразные примеры: документы с таблицами, прерываниями, различиями в форматировании.

 

Выбор документов в коллекцию

 

Для обучения лучше выбирать все документы коллекции, но допускается частичное выделение. Главное — обеспечить качество и разнообразие примеров. Это влияет на точность извлечения данных.

 

Данные

 

После обучения можно протестировать модель. Syntex покажет:

 

  • Какие данные были распознаны

  • Уровень уверенности (confidence score) по каждому полю

  • Таблицы и значения, извлечённые из документа

 

Важно понимать, что цифры confidence score не всегда отражают фактическую точность на практике.

 

Тест

 

Для теста достаточно загрузить документ в SharePoint-библиотеку с привязанной моделью. Syntex автоматически определит тип документа и извлечёт нужные данные. Если тип не подходит ни под одну модель — контент будет оставлен без обработки.

 

Как работает модель

 

Каждая модель применяется ко всем документам библиотеки. После загрузки документ анализируется, и если модель находит соответствие — извлекает нужные поля. Результат виден во вьюшке SharePoint, отображающей поля модели.

 

Недостаток — нет гибкой настройки, какие документы обрабатывать, а какие — нет. Это значит, что даже неподходящие файлы могут быть просканированы (и засчитаны как транзакции), хоть и не будут распознаны.

 

Время операции

 

На практике распознавание происходит в среднем за 15–20 секунд. Иногда дольше. Явной нотификации о завершении нет — только визуально в SharePoint, по появлению данных в полях.

 

Можно настроить дополнительный Power Automate Flow, чтобы уведомлять пользователя о завершении обработки, например, по изменению статуса обработки документа на “finished”.

 

Как подключить Syntex

 

Чтобы начать работу с Microsoft Syntex:

 

  • Необходима подписка Azure (PSE Go).

  • Нужно настроить биллинг.

  • Отдельная лицензия на Syntex не требуется (по состоянию на сейчас), но оплата производится за транзакции.

 

Плюсы и минусы

 

Плюсы:

  • Глубокая интеграция с SharePoint

  • Удобный интерфейс для создания моделей

  • Возможность кастомизации без кода

  • Интеграция с Power Automate

  • Автоматизация рутинной работы с документами

 

Минусы:

  • Отсутствие out-of-the-box фильтрации по типу документов

  • Возможны ошибки при открытии моделей (например, “something went wrong”)

  • Отсутствие чёткой нотификации о завершении обработки

  • Высокая стоимость при больших объёмах документов и использовании нескольких моделей

  • Используется только в SharePoint (не подходит напрямую для CRM)

 

Заключение

 

Microsoft Syntex — мощное решение для автоматизации обработки документов в SharePoint. Однако, несмотря на потенциал, оно не всегда стабильно и требует вдумчивой настройки и расчёта затрат. Мы выбрали Syntex, потому что основной документооборот у клиента — в SharePoint, и решение органично вписалось в их процесс. Но прежде чем использовать Syntex, важно обсудить все детали с клиентом, чтобы стоимость и ограничения не стали неприятным сюрпризом.

 
 
 

Comments


Power Platform logo

Подписывайся на наши ресурсы.

  • Telegram
  • LinkedIn
  • Facebook
  • Twitter
  • YouTube
  • Instagram

© 2035 by The Pop Show. Powered and secured by Wix

bottom of page