活動
2025-11-28から2025-12-27まで
2025-12-17
- 17:07 機能 #770: 請求書の項目抽出
- PowerPointの資料を作成してみました。
こんな感じでしょうか?
2025-12-15
- 18:18 機能 #770: 請求書の項目抽出
- 評価シートはいただいたもので問題ないと思います。
- 16:42 機能 #770: 請求書の項目抽出
- LLMを使用した評価のシートも値がない場合の修正をして全体統計シートを追加してみました。
説明文も少し追加してみてますがどんなもんでしょうか?
2025-12-11
- 13:12 機能 #770: 請求書の項目抽出
- 前回のものに先頭に全体統計のシートをつけてみました。
こんな感じで良いでしょうか?
2025-12-09
- 18:49 機能 #770: 請求書の項目抽出
- extarctが差分は取得した文字列そのままでllmの方は正解データとの差分をLLMで多少の違いは
無視してもらって出力した結果から作成したものです。なので正解データの方が送り仮名等で
間違っているものが吸収されているはずですが検... - 18:07 機能 #770: 請求書の項目抽出
- ありがとうございます。extrac が初期に作ったルールベースの結果、 llm が今回のLLM2段構えによる手法で、あっているでしょうか。
今回の手法は、LLM で対応できない場合にルールベースにフォールバックするようになっていると...
2025-12-08
- 18:42 機能 #770: 請求書の項目抽出
- 少し違うかもしれませんが近似値を段階的にカウントして
PDFからの文字取り出し、OCRでの文字化、トータルの3種類と
ドキュメント毎での計算を追加してみました。
minerがPDF MInerでのテキスト取り出し、azure...
2025-11-28
- 17:21 機能 #770: 請求書の項目抽出
- PDFからの画像抽出のメモ
・画像でJPEGがそのまま埋め込まれているのは容易に出力可能。
・スキャンした画像をそのまま埋め込んでいるタイプのPDFはJPEGがそのまま入っているパターンが多い.
・会社のロゴだけというタイプ... - 13:49 機能 #770: 請求書の項目抽出
- 内容は同じですがOCRでAzureを使用したかわかりやすいように各シートの最後のカラムに使用OCRの種別(a:azure m:pdfminer)を追加しました。
他の形式にエクスポート: Atom