活動
2025-07-26から2025-08-24まで
2025-08-22
- 17:45 機能 #770: 請求書の項目抽出
Google OCRで振込先情報の成績が悪かったのは、座標系がPdfMinerやPaddleOCRはY座標が下が0なのに対して
Google OCRは上が0で下になるほど値が大きくなっていていくのでグループ化の関数で想定と違って...- 16:05 機能 #770: 請求書の項目抽出
- 9月末までに
* インフォマートさん提供の環境に載せる(Docker)
* 画像取り込み・結果表示画面
が必要なので、そのつなぎを優先してお願いします。 - 10:19 機能 #770: 請求書の項目抽出
- 8/21現在の進捗状況です。
今回は主に「明細」の取得の作成を行なっていて、やっと枠組みができたところなので内容の検討と細かな作り込みはこれからとなります。
「振込先」の評価値は計算する関数がバグっていて修正したら成績がかなり落ち...
2025-08-08
- 16:10 機能 #770: 請求書の項目抽出
- 振込先情報と詳細情報の評価あたりを実装していて、とりあえず振込先情報は少し取れるようになりましたので評価をしてみました。
PDFからPdfMinerでテキストを取得できないものはOCRの結果を使ったテキストを使用するようにして評価で...
他の形式にエクスポート: Atom