kyegomez · oyi77 · May 20, 2026 · May 20, 2026 · May 20, 2026 · May 20, 2026
diff --git a/README_BERKAHKARYA.md b/README_BERKAHKARYA.md
@@ -0,0 +1,113 @@
+# OpenMythos-BerkahKarya
+
+> Fork of [kyegomez/OpenMythos](https://github.com/kyegomez/OpenMythos) with consumer hardware optimizations.
+
+## 🚀 What's New in This Fork
+
+### Sprint 1: INT4/INT8 Quantization + Expert Offloading ✅
+- **INT4/INT8 weight quantization** — 4x memory reduction for MoE expert layers
+- **Expert offloading** — GPU ↔ CPU ↔ NVMe memory hierarchy
+- **Consumer hardware support** — Run mythos_1b on RTX 3060 12GB
+
+### Sprint 2: LoRA Training Pipeline ✅
+- **LoRA adapters** — Fine-tune only ~0.5% of parameters
+- **Colab notebook** — Free T4 GPU training (~30-60 min)
+- **QLoRA mode** — INT4 + LoRA = 8GB VRAM
+- **Finance demo data** — Trading, business plans, ad optimization
+
+## 📦 Installation
+
+```bash
+git clone https://github.com/oyi77/OpenMythos-BerkahKarya.git
+cd OpenMythos-BerkahKarya
+pip install -e .
+```
+
+## 🎯 Quick Start
+
+### Quantized Inference (Consumer Hardware)
+```python
+from open_mythos import OpenMythos, mythos_1b
+from open_mythos.quantization import quantize_model
+from open_mythos.expert_offloader import ExpertOffloader
+
+model = OpenMythos(mythos_1b())
+model = quantize_model(model, bits=4, group_size=128)
+
+offloader = ExpertOffloader(model, gpu_experts=4, cache_experts=16)
+offloader.prepare()
+```
+
+### LoRA Fine-tuning
+```python
+from open_mythos import OpenMythos, mythos_1b
+from open_mythos.lora import LoRAConfig, apply_lora, save_lora_adapter
+
+model = OpenMythos(mythos_1b())
+model = apply_lora(model, LoRAConfig(rank=16, alpha=32))
+
+# Train on your data...
+
+save_lora_adapter(model, 'my_adapter.pt')
+```
+
+### CLI Training
+```bash
+# Standard LoRA (16GB VRAM)
+python training/lora_finetune.py --variant 1b --dataset finance
+
+# QLoRA (8GB VRAM, fits Colab free T4)
+python training/lora_finetune.py --variant 1b --dataset finance --qlora
+```
+
+## 📊 PRs to Upstream
+
+| PR | Feature | Status |
+|----|---------|--------|
+| [#74](https://github.com/kyegomez/OpenMythos/pull/74) | INT4/INT8 Quantization + Expert Offloading | Open |
+| [#75](https://github.com/kyegomez/OpenMythos/pull/75) | LoRA Training Pipeline + Colab Notebook | Open |
+
+## 🏗️ Development Roadmap
+
+- [x] Sprint 1: INT4/INT8 Quantization + Expert Offloading (PR #74)
+- [x] Sprint 2: LoRA Training Pipeline + Colab Notebook (PR #75)
+- [x] Sprint 3: Ring Attention + KV Cache Compression (PR #76)
+- [x] Sprint 4: Finance Domain Adapters + GGUF Export (PR #77)
+- [x] Sprint 5: Finance Training Data + Colab Notebook
+
+## 🧠 Train Finance Model
+
+```bash
+# Generate training data
+python3 data/generate_finance_data.py
+
+# Train locally (QLoRA, 8GB VRAM)
+python training/lora_finetune.py --variant 1b --dataset finance --qlora
+
+# Or use Colab (FREE): notebooks/Train_Finance_Model.ipynb
+```
+
+Training data: 252 samples across 6 finance domains:
+- Trading (XAUUSD, forex, crypto, 8 pairs)
+- Business Plans (8 types)
+- Ad Copy (Meta, Google, TikTok, Shopee)
+- Cashflow Management
+- Indonesian Market (IDX, e-commerce)
+- Risk Management & Portfolio
+
+## 📝 License
+
+MIT (same as upstream)
+
+## 🤝 Contributing
+
+1. Fork this repo
+2. Create a feature branch
+3. Make your changes
+4. Submit a PR to upstream (kyegomez/OpenMythos)
+
+## 🔗 Links
+
+- [Upstream Repo](https://github.com/kyegomez/OpenMythos)
+- [HuggingFace Models](https://huggingface.co/models?search=openmythos)
+- [Original Paper](https://arxiv.org/abs/2502.05171) (Huginn/Raven)
diff --git a/data/finance/finance_dataset.jsonl b/data/finance/finance_dataset.jsonl
diff --git a/data/finance/train.jsonl b/data/finance/train.jsonl
diff --git a/data/finance/val.jsonl b/data/finance/val.jsonl