プロジェクト

全般

プロフィール

Kano Yoshinobu の活動

2025-09-17から2025-10-16まで

2025-10-07

14:05 請求書OCR 機能 #770: 請求書の項目抽出

スケジュール:
10/24 定例
11/21 定例 その後のメンテナンス方法を説明
ということですので、少々押していますが、
* 当面の優先事項は、座標と属性を使ったグルーピングの性能向上。
実装や設計への変更が一番...
Kano Yoshinobu
12:54 請求書OCR 機能 #770: 請求書の項目抽出
メモ
明細のうち所属が不明なテキスト断片の処理:
 人間の判断をできるだけ再現する
 テキスト断片の周辺テキストの、インデント量・フォントサイズ・行間隔をデータ取得し、(何らか)パターン化して判断する
Kano Yoshinobu

2025-10-01

14:59 請求書OCR 機能 #770: 請求書の項目抽出
> ・明細項目が段組になっているものは取得結果がおかしい
検討課題
> ・明細の内訳項目のカラムに明細日時が入っているものが取れない
日時など項目の値の種類判別、抽出はLLMに任せたい
> ・今は合計があれば明細処理を...
Kano Yoshinobu
 

他の形式にエクスポート: Atom