Hoshino Yuji の活動
2025-06-21から2025-07-20まで
2025-07-18
- 16:26 請求書OCR Wiki編集: Wiki (#1)
- 14:19 請求書OCR 機能 #770: 請求書の項目抽出
- ミーティング用サンプルです。
pdfが読み取り元の請求書ファイル
txtがpdfから取り出したテキストとその座標
jsonが文字列と座標をグループ化したファイルになります。
検証AI-OCR読み取り結果比較がinfomar... - 10:03 請求書OCR 機能 #770: 請求書の項目抽出
- 0717版にファイルを更新
2025-07-17
- 10:38 請求書OCR 機能 #770: 請求書の項目抽出
- 前回から正解数はあまり変わってないのですが7/16での結果です。
正解データとして使用しているファイルもアップロードしておきます。
いただいているpdfファイルは214ファイルあるのですが、ファイル中からテキストの取得できるフ...
2025-07-11
- 17:34 請求書OCR 機能 #770: 請求書の項目抽出
- いろいろ修正して少しづつ正解数が増えてきて最初の936から現在1352。
間違いが多いところでは消費税10%や消費税8%の取得あたりなのでその辺りが課題です。
2025-07-02
- 14:43 請求書OCR 機能 #770: 請求書の項目抽出
- Java版からPtyhonに移植したもののデバッグがだいたい終了して正解データを作り直して実行した結果ファイルです。
今回から正解、抽出結果ともないものは正解数には入れないようにして計算しています。
◯のものが正解で、間違っている...
他の形式にエクスポート: Atom