全般

プロフィール

Kano Yoshinobu

  • 登録日: 2013-12-27
  • 最終接続日: 2026-03-10

チケット

プロジェクト

  • GPU (管理者, 開発者, 報告者, 2023-11-06)
  • 請求書OCR (管理者, 開発者, 報告者, 2025-03-27)

活動

2025-12-15

18:18 請求書OCR 機能 #770: 請求書の項目抽出
評価シートはいただいたもので問題ないと思います。

2025-12-09

18:07 請求書OCR 機能 #770: 請求書の項目抽出
ありがとうございます。extrac が初期に作ったルールベースの結果、 llm が今回のLLM2段構えによる手法で、あっているでしょうか。
今回の手法は、LLM で対応できない場合にルールベースにフォールバックするようになっていると...

2025-11-19

18:09 請求書OCR 機能 #770: 請求書の項目抽出
いちおう整理してメモします。私の理解では、↑の結果はjsonファイルのピックアップ・ループ・集計もLLMに一括してやらせていると思うのですが、それだとLLMが間違ったことをしそうなので、
* 個別jsonファイルペア間の比較評価だけ...
16:57 請求書OCR 機能 #770: 請求書の項目抽出
LLMでの自動評価の件、こちら確認お願いします:
> こちら全ファイルを一回分のLLM入出力で処理させてますでしょうか?
> 入力が長いと失敗しがちなので、PDF1ファイル分ずつ呼び出すようにして、その結果の集計は別途書いていただ...

2025-11-14

20:01 請求書OCR 機能 #770: 請求書の項目抽出
ログインできなかったため、ファイルを見ることができないのですが、
こちら全ファイルを一回分のLLM入出力で処理させてますでしょうか?
入力が長いと失敗しがちなので、PDF1ファイル分ずつ呼び出すようにして、その結果の集計は別途書い...
19:08 請求書OCR 機能 #770: 請求書の項目抽出
学生への依頼は、直接Slackに投げていただけないでしょうか?
14:32 請求書OCR 機能 #770: 請求書の項目抽出
お願い事
・LLMによる自動評価の結果共有
(後日)LLM評価用プロンプトの調整
・学生アルバイトへのグルーピング採点依頼(とりあえず数件ぐらい)
・LLMによる失敗事例の自動要因分析出力
・AWS実行インスタンスへのアクセ...
14:18 請求書OCR Wiki編集: Wiki (#7)

2025-10-07

14:05 請求書OCR 機能 #770: 請求書の項目抽出

スケジュール:
10/24 定例
11/21 定例 その後のメンテナンス方法を説明
ということですので、少々押していますが、
* 当面の優先事項は、座標と属性を使ったグルーピングの性能向上。
実装や設計への変更が一番...
12:54 請求書OCR 機能 #770: 請求書の項目抽出
メモ
明細のうち所属が不明なテキスト断片の処理:
 人間の判断をできるだけ再現する
 テキスト断片の周辺テキストの、インデント量・フォントサイズ・行間隔をデータ取得し、(何らか)パターン化して判断する

他の形式にエクスポート: Atom