Add completeness judge #1410

pvn25 · 2024-12-04T02:42:07Z

Add LLM-based judge to check for completeness: if the response is complete with respect to the information in the document.

Signed-off-by: Yoav Katz <[email protected]>

yoavkatz · 2024-12-04T10:59:17Z

prepare/metrics/llm_as_judge/conversation_completeness.py

+    },
+    "generic_inference_engine": {
+        "model_name": "generic",
+        "inference_model": (GenericInferenceEngine()),


There is now a simpler way to support multiple inference engines in the judge using one consistent API, and that's with CrossProviderInferenceEngine.

https://www.unitxt.ai/en/latest/docs/inference.html#creating-a-cross-api-engine

It uses the standard OpenAI params names.

ok. I updated the engine to CrossProvider. Pls check now.

yoavkatz · 2024-12-04T15:16:59Z

Please see these formatting errors:

prepare/templates/response_assessment/judges/completeness/v5.py:6:6056: RUF001 String contains ambiguous ’ (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)? prepare/templates/response_assessment/judges/completeness/v5.py:6:6169: RUF001 String contains ambiguous `’` (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)?
prepare/templates/response_assessment/judges/completeness/v5.py:6:7288: RUF001 String contains ambiguous ’ (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)? prepare/templates/response_assessment/judges/completeness/v5.py:6:7401: RUF001 String contains ambiguous `’` (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)?
prepare/templates/response_assessment/judges/completeness/v5.py:6:8672: RUF001 String contains ambiguous ’ (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)? prepare/templates/response_assessment/judges/completeness/v5.py:6:8785: RUF001 String contains ambiguous `’` (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)?
prepare/templates/response_assessment/judges/completeness/v5.py:6:10086: RUF001 String contains ambiguous ’ (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)? prepare/templates/response_assessment/judges/completeness/v5.py:6:10199: RUF001 String contains ambiguous `’` (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)?
prepare/templates/response_assessment/judges/completeness/v5.py:6:11441: RUF001 String contains ambiguous ’ (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)? prepare/templates/response_assessment/judges/completeness/v5.py:6:11554: RUF001 String contains ambiguous `’` (RIGHT SINGLE QUOTATION MARK). Did you mean (GRAVE ACCENT)?
Found 11 errors (1 fixed, 10 remaining).

add completeness judge

67b4fad

pvn25 requested review from eladven and yoavkatz December 4, 2024 02:42

Run prepare files and dded msssing json files to catalog

4bd3c03

Signed-off-by: Yoav Katz <[email protected]>

yoavkatz reviewed Dec 4, 2024

View reviewed changes

yoavkatz and others added 3 commits December 4, 2024 17:17

Merge branch 'main' into add_completeness_judge

37b4825

fix formatting issue

4a32ad3

update inference enginer to cross provider

76e7502

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add completeness judge #1410

Add completeness judge #1410

pvn25 commented Dec 4, 2024

yoavkatz Dec 4, 2024

yoavkatz Dec 4, 2024

pvn25 Dec 10, 2024

yoavkatz commented Dec 4, 2024 •

edited

Loading

Add completeness judge #1410

Are you sure you want to change the base?

Add completeness judge #1410

Conversation

pvn25 commented Dec 4, 2024

yoavkatz Dec 4, 2024

Choose a reason for hiding this comment

yoavkatz Dec 4, 2024

Choose a reason for hiding this comment

pvn25 Dec 10, 2024

Choose a reason for hiding this comment

yoavkatz commented Dec 4, 2024 • edited Loading

yoavkatz commented Dec 4, 2024 •

edited

Loading