プロジェクト

全般

プロフィール

活動

2025-07-24から2025-08-22まで

2025-08-22

17:45 機能 #770: 請求書の項目抽出

Google OCRで振込先情報の成績が悪かったのは、座標系がPdfMinerやPaddleOCRはY座標が下が0なのに対して
Google OCRは上が0で下になるほど値が大きくなっていていくのでグループ化の関数で想定と違って...
Hoshino Yuji
16:05 機能 #770: 請求書の項目抽出
9月末までに
* インフォマートさん提供の環境に載せる(Docker)
* 画像取り込み・結果表示画面
が必要なので、そのつなぎを優先してお願いします。
Kano Yoshinobu
10:19 機能 #770: 請求書の項目抽出
8/21現在の進捗状況です。
今回は主に「明細」の取得の作成を行なっていて、やっと枠組みができたところなので内容の検討と細かな作り込みはこれからとなります。
「振込先」の評価値は計算する関数がバグっていて修正したら成績がかなり落ち...
Hoshino Yuji

2025-08-08

16:10 機能 #770: 請求書の項目抽出
振込先情報と詳細情報の評価あたりを実装していて、とりあえず振込先情報は少し取れるようになりましたので評価をしてみました。
PDFからPdfMinerでテキストを取得できないものはOCRの結果を使ったテキストを使用するようにして評価で...
Hoshino Yuji

2025-07-25

18:43 機能 #770: 請求書の項目抽出
GoogleのEnterprise OCRを繋げて実行した結果が出ましたので結果を追加しておきます。
PaddleOCRで読み込ませるイメージの解像度を上げてみたところ正解数が418まで上がりましたが
GoogleのOCRだと...
Hoshino Yuji

2025-07-24

17:36 機能 #770: 請求書の項目抽出
GoogleのEnterprise Document OCRの結果が取れたので追加しておきます。
Google Driveのは認識精度的にちょっと使えない感じでしたが所々で間違っている箇所はありますがテキスト部に関してはかなり良いと...
Hoshino Yuji
 

他の形式にエクスポート: Atom