GitHub - bjamiolkowski/parrotly-personal-knowledge-assistant: Modular RAG system with hybrid retrieval, reranking, and multi-provider LLM support (OpenAI & Ollama). Includes observability features like latency, token usage, and cost tracking.

Build and chat with your private knowledge base using Retrieval-Augmented Generation.

What is Parrotly?

Parrotly is a modular AI application that allows users to create a private knowledge base from their own documents and interact with it using natural language.

The system focuses on building a reliable Retrieval-Augmented Generation pipeline with hybrid retrieval, reranking, evaluation, and support for both cloud-based and local LLM providers.

Capabilities

Parrotly allows users to:

Upload PDF and TXT documents
Build a searchable private knowledge base
Ask questions grounded in document context
Generate document summaries
Inspect retrieved sources used for answers
Compare different retrieval configurations
Monitor token usage, latency and estimated costs
Switch between OpenAI and local models using Ollama

Demo

Main application view

Query and source inspection

Key Features

Document Processing

PDF and TXT document ingestion
Text splitting with metadata preservation
Document parsing and preprocessing pipeline

Retrieval Pipeline

Dense retrieval using FAISS vector search and embeddings
Sparse retrieval using TF-IDF keyword search
Hybrid retrieval combining semantic similarity and keyword matching
Post-retrieval reranking based on relevance scoring

LLM Integration

Cloud-based generation using OpenAI models
Local model execution through Ollama
Context-grounded response generation
Token usage and cost tracking

Evaluation & Monitoring

Automated retrieval evaluation pipeline
Experiment comparison across retrieval configurations
Token usage, cost and latency monitoring

Evaluation

A key part of Parrotly is an experiment-driven approach to improving retrieval quality.

Instead of relying on a single retrieval method, the system includes an evaluation framework for benchmarking different configurations and selecting the most effective setup.

The evaluation compares:

Dense semantic retrieval using vector search
Sparse retrieval using TF-IDF keyword search
Hybrid retrieval combining both approaches
Different retrieval parameters and Top-K configurations

Performance is measured using:

Top-K Accuracy
Hit Rate
Mean Reciprocal Rank (MRR)
Recall@K
Retrieval latency

Results

Hybrid retrieval achieved the best overall ranking performance by combining semantic understanding with exact keyword matching.

Retrieval Strategy	Top-1 Accuracy	Top-5 Hit Rate	MRR	Recall@5
Dense Search	0.90	1.00	0.92	1.00
TF-IDF Search	0.80	1.00	0.85	1.00
Hybrid Search	0.90	1.00	0.95	1.00

The results showed that hybrid retrieval improved ranking quality while maintaining full source recall.

Detailed experiment outputs are exported automatically:

evaluation/results/retrieval_comparison.csv
evaluation/results/retrieval_details.json

Tech Stack

AI & Retrieval

LangChain
FAISS
OpenAI API
Ollama
TF-IDF retrieval

Application

Python
Streamlit
Pydantic

Data Processing

NumPy
Pandas
Scikit-learn

Infrastructure

Docker
Docker Compose

Running Locally

Clone repository

git clone https://github.com/bjamiolkowski/modular-rag-assistant.git

cd modular-rag-assistant

Create virtual environment

python -m venv .venv

source .venv/bin/activate

Windows:

.venv\Scripts\activate

Install dependencies

pip install -r requirements.txt

Configure environment variables

Create .env file:

OPENAI_API_KEY=your_openai_api_key

Optional local model configuration:

OLLAMA_MODEL=llama3

Run application

streamlit run app.py

Application will be available at:

http://localhost:8501

Docker

Build and run:

docker compose up --build

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
api		api
assets		assets
data		data
evaluation		evaluation
rag		rag
storage		storage
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

What is Parrotly?

Capabilities

Demo

Main application view

Query and source inspection

Key Features

Document Processing

Retrieval Pipeline

LLM Integration

Evaluation & Monitoring

Evaluation

Results

Tech Stack

AI & Retrieval

Application

Data Processing

Infrastructure

Running Locally

Clone repository

Create virtual environment

Install dependencies

Configure environment variables

Run application

Docker

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

What is Parrotly?

Capabilities

Demo

Main application view

Query and source inspection

Key Features

Document Processing

Retrieval Pipeline

LLM Integration

Evaluation & Monitoring

Evaluation

Results

Tech Stack

AI & Retrieval

Application

Data Processing

Infrastructure

Running Locally

Clone repository

Create virtual environment

Install dependencies

Configure environment variables

Run application

Docker

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages