com.judgmentlabs.judgeval.JudgmentClient

public class JudgmentClient extends Object

Main client for running evaluations with Judgment Labs.

The JudgmentClient provides functionality to:

Run evaluations with multiple examples and scorers
Validate inputs and scorer configurations
Poll for evaluation results
Assert test results for automated testing

Basic Usage


 JudgmentClient client = new JudgmentClient(apiKey, organizationId);

 List<Example> examples = Arrays.asList(
         Example.builder()
                 .input("What is 2+2?")
                 .actualOutput("4")
                 .expectedOutput("4")
                 .build());

 List<BaseScorer> scorers = Arrays.asList(
         AnswerCorrectnessScorer.create(0.8));

 List<ScoringResult> results = client.runEvaluation(
         examples, scorers, "my-project", "test-run", "gpt-4", false);

Test Mode


 // Enable test assertions
 List<ScoringResult> results = client.runEvaluation(
         examples, scorers, "my-project", "test-run", "gpt-4", true);
 // This will throw JudgmentTestError if any tests fail

See Also:

Constructor Summary

Constructors

Constructor

Description

JudgmentClient(String apiKey, String organizationId)
Method Summary

Modifier and Type

Method

Description

List<ScoringResult>

runEvaluation(Example example, BaseScorer scorer, String projectName, String evalRunName)

List<ScoringResult>

runEvaluation(Example example, BaseScorer scorer, String projectName, String evalRunName, String model)

List<ScoringResult>

runEvaluation(List<Example> examples, List<BaseScorer> scorers, String projectName, String evalRunName)

List<ScoringResult>

runEvaluation(List<Example> examples, List<BaseScorer> scorers, String projectName, String evalRunName, String model, boolean assertTest)

Runs an evaluation with the specified examples and scorers.

Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

Constructor Details
- JudgmentClient
  
  public JudgmentClient(String apiKey, String organizationId)
Method Details
- runEvaluation
  
  public List<ScoringResult> runEvaluation(List<Example> examples, List<BaseScorer> scorers, String projectName, String evalRunName, String model, boolean assertTest)
  Runs an evaluation with the specified examples and scorers.
  The method performs the following validations:
  
  All examples must have the same field keys
  Examples must contain required parameters for all scorers
  Cannot mix local and Judgment API scorers
  All input parameters must be valid
  Parameters:
  
  examples - the examples to evaluate
  
  scorers - the scorers to use for evaluation
  
  projectName - the project name
  
  evalRunName - the evaluation run name
  
  model - the model used for generation (can be null, will use default)
  
  assertTest - whether to assert test results and throw exceptions on failures
  
  Returns:
  
  a list of scoring results for each example
  
  Throws:
  
  IllegalArgumentException - if inputs are invalid
  
  JudgmentRuntimeError - if evaluation fails
  
  JudgmentTestError - if assertTest is true and any tests fail
- runEvaluation
  
  public List<ScoringResult> runEvaluation(List<Example> examples, List<BaseScorer> scorers, String projectName, String evalRunName)
- runEvaluation
  
  public List<ScoringResult> runEvaluation(Example example, BaseScorer scorer, String projectName, String evalRunName, String model)
- runEvaluation
  
  public List<ScoringResult> runEvaluation(Example example, BaseScorer scorer, String projectName, String evalRunName)

Class JudgmentClient

Basic Usage

Test Mode

Constructor Summary

Method Summary

Methods inherited from class java.lang.Object

Constructor Details

JudgmentClient

Method Details

runEvaluation

runEvaluation

runEvaluation

runEvaluation