Kano Yoshinobu
活動
2025-12-15
- 18:18 請求書OCR 機能 #770: 請求書の項目抽出
- 評価シートはいただいたもので問題ないと思います。
2025-12-09
- 18:07 請求書OCR 機能 #770: 請求書の項目抽出
- ありがとうございます。extrac が初期に作ったルールベースの結果、 llm が今回のLLM2段構えによる手法で、あっているでしょうか。
今回の手法は、LLM で対応できない場合にルールベースにフォールバックするようになっていると...
2025-11-19
- 18:09 請求書OCR 機能 #770: 請求書の項目抽出
- いちおう整理してメモします。私の理解では、↑の結果はjsonファイルのピックアップ・ループ・集計もLLMに一括してやらせていると思うのですが、それだとLLMが間違ったことをしそうなので、
* 個別jsonファイルペア間の比較評価だけ... - 16:57 請求書OCR 機能 #770: 請求書の項目抽出
- LLMでの自動評価の件、こちら確認お願いします:
> こちら全ファイルを一回分のLLM入出力で処理させてますでしょうか?
> 入力が長いと失敗しがちなので、PDF1ファイル分ずつ呼び出すようにして、その結果の集計は別途書いていただ...
2025-11-14
- 20:01 請求書OCR 機能 #770: 請求書の項目抽出
- ログインできなかったため、ファイルを見ることができないのですが、
こちら全ファイルを一回分のLLM入出力で処理させてますでしょうか?
入力が長いと失敗しがちなので、PDF1ファイル分ずつ呼び出すようにして、その結果の集計は別途書い... - 19:08 請求書OCR 機能 #770: 請求書の項目抽出
- 学生への依頼は、直接Slackに投げていただけないでしょうか?
- 14:32 請求書OCR 機能 #770: 請求書の項目抽出
- お願い事
・LLMによる自動評価の結果共有
(後日)LLM評価用プロンプトの調整
・学生アルバイトへのグルーピング採点依頼(とりあえず数件ぐらい)
・LLMによる失敗事例の自動要因分析出力
・AWS実行インスタンスへのアクセ... - 14:18 請求書OCR Wiki編集: Wiki (#7)
2025-10-07
- 14:05 請求書OCR 機能 #770: 請求書の項目抽出
スケジュール:
10/24 定例
11/21 定例 その後のメンテナンス方法を説明
ということですので、少々押していますが、
* 当面の優先事項は、座標と属性を使ったグルーピングの性能向上。
実装や設計への変更が一番...- 12:54 請求書OCR 機能 #770: 請求書の項目抽出
- メモ
明細のうち所属が不明なテキスト断片の処理:
人間の判断をできるだけ再現する
テキスト断片の周辺テキストの、インデント量・フォントサイズ・行間隔をデータ取得し、(何らか)パターン化して判断する
他の形式にエクスポート: Atom