Ragged

Simple utilities for piece-wise evaluation of LLM based chat and retrieval systems

Setup

Build from source

pip install -e .

GUI quickstart

VectorDB retrieval eval

ragged --quickstart vectordb

Demo

Dataset Quality eval [Coming soon]

End-to-End RAG eval [Coming soon]

API Usage

VectorDB retrieval eval

from ragged.dataset import LlamaIndexDataset
from ragged.metrics.retriever import HitRate
from ragged.search_utils import QueryType
from lancedb.rerankers import CrossEncoderReranker

# 1. Select dataset
# Automatically download the dataset from llama-hub or pass existing path="/path/to/dataset"
dataset = LlamaIndexDataset("Uber10KDataset2021")

# 2. Select eval metrics
hit_rate = HitRate(
            dataset,
            embedding_registry_id="sentence-transformers",
            embed_model_kwarg={"name":"BAAI/bge-small-en-v1.5"},
            reranker=CohereReranker(),
            )

# 3. Evaluate on desired query types

#print(hit_rate.evaluate(top_k=5, query_type=QueryType.VECTOR)) # Evaluate vector search
print(hit_rate.evaluate(top_k=5, query_type="all")) # Evaliate all possible query types

Generate a custom semantic search dataset

Most of popular toy datasets are not semantically challenging enough to evaluate the performance of LLM based retrieval systems. Most of them work well with simple BM25 based retrieval systems. To generate a custom dataset, that is semantically challenging, you can use the following code snippet. NOTE: directory can contain pdfs, txt files or any other file format that can be handled by Llama-index directory reader.

from ragged.dataset.gen.gen_retrieval_data import gen_query_context_dataset
fragged.dataset.gen.llm_calls import OpenAIInferenceClient

clinet = OpenAIInferenceClient()
df = gen_query_context_dataset(directory="data/source_files", inference_client=clinet)

print(df.head())
# save the dataframe
df.to_csv("data.csv")

Now, you can evaluate this dataset using the ragged --quickstart vectordb GUI or via the API:

from ragged.dataset.csv import CSVDataset
from ragged.metrics.retriever import HitRate
from lancedb.rerankers import CohereReranker

data = CSVDataset(path="data.csv")
reranker = CohereReranker()

hit_rate = HitRate(data, reranker=reranker, embedding_registry_id="openai", embed_model_kwarg={"model":"text-embedding-3-small"})
res = hit_rate.evaluate(top_k=5, query_type="all")
print(res)

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
.github/workflows		.github/workflows
ragged		ragged
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.github/workflows

.github/workflows

ragged

ragged

tests

tests

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

pyproject.toml

pyproject.toml

Repository files navigation

Ragged

Setup

GUI quickstart

VectorDB retrieval eval

Dataset Quality eval [Coming soon]

End-to-End RAG eval [Coming soon]

API Usage

VectorDB retrieval eval

Generate a custom semantic search dataset

Dataset Quality eval [Coming soon]

End-to-End RAG eval [Coming soon]

About

Releases

Packages

Languages

License

lancedb/ragged

Folders and files

Latest commit

History

Repository files navigation

Ragged

Setup

GUI quickstart

VectorDB retrieval eval

Dataset Quality eval [Coming soon]

End-to-End RAG eval [Coming soon]

API Usage

VectorDB retrieval eval

Generate a custom semantic search dataset

Dataset Quality eval [Coming soon]

End-to-End RAG eval [Coming soon]

About

Resources

License

Stars

Watchers

Forks

Languages