Hoshino Yuji の活動
2025-09-19から2025-10-18まで
2025-10-16
- 10:23 請求書OCR 機能 #770: 請求書の項目抽出
テキストのグループ化時のテキストの高さの違いで別フォントと判断して別グループに判断するようにして実験してみました。
厳密に同じ高さだと正解がかなり落ちてしまうので2pixelの差までは同じとして判断しています。
請求元情報が少...
2025-10-08
- 09:59 請求書OCR Wiki編集: Wiki (#5)
2025-10-01
- 13:19 請求書OCR 機能 #770: 請求書の項目抽出
修正履歴
・項目番号取得で項目番号は数字のみとした
・金額等の数字取得で数字のみでなくコンマで3桁に区切ってあるものも取得する
・請求元で不要な"発行元:"等を削除する
・明細項目の取得対象に'検索企業'を追加
・明細に...
2025-09-25
- 17:30 請求書OCR 機能 #770: 請求書の項目抽出
インフォマートさんにAzure AI VisonのAPIのキーを作成していただいたので
少しデバッグとAzure用の修正が進み、数値的にはPaddleOCRよりも良くなりました。
まあまあいい値になってきたので納品のコードでG...
2025-09-22
- 15:33 請求書OCR 機能 #770: 請求書の項目抽出
- OCRをMicrosoftのAsure AI Vision v3.2 GA Read APIに変更して、とりあえず実行はできるようになりました。
Read APIも発表された時は日本語はかなりダメだったのですが最新のモデルではパ...
他の形式にエクスポート: Atom