LLM Engineering

140 articles

LLM Engineering

BishopFox/llm-testing-findings: The Missing Standard for Documenting AI Security Vulnerabilities

By Rob Ragan ★ 74 Unknown May 10, 2026

LLM Engineering

LitGPT: The Zero-Abstraction Framework for Production LLM Training

By Rob Ragan ★ 13.3k Unknown May 10, 2026

LLM Engineering

getML: The C++ Engine That Makes Feature Engineering on Relational Data 1000x Faster

By Rob Ragan ★ 241 Unknown May 10, 2026

LLM Engineering

Weaponizing Machine Learning Models: How Pickle Deserialization Turns TensorFlow into a Trojan Horse

By Rob Ragan ★ 43 Unknown May 10, 2026

LLM Engineering

Inside GCG: The Gradient-Based Attack That Broke LLM Alignment

By Rob Ragan ★ 4.7k Unknown May 10, 2026

LLM Engineering

AutoRedTeam: Training Language Models to Attack Other Language Models

By Rob Ragan ★ 15 Unknown May 10, 2026

LLM Engineering

MiniHF: Building Domain-Specific Language Models Through Constitutional AI and Tree Search

By Rob Ragan ★ 185 Unknown May 10, 2026

LLM Engineering

Running Mixtral-8x7B on Consumer Hardware: Expert Offloading and Mixed Quantization

By Rob Ragan ★ 2.3k Unknown May 10, 2026

LLM Engineering

Mangio-RVC-Fork: When Voice Conversion Meets Ensemble Pitch Detection

By Rob Ragan ★ 1.2k Unknown May 10, 2026

LLM Engineering

Axolotl: The Config-Driven LLM Fine-Tuning Framework Racing Ahead of Research

By Rob Ragan ★ 11.9k Unknown May 10, 2026

LLM Engineering

LLM Sherpa: How Smart Chunking Fixes RAG's Biggest Problem

By Rob Ragan ★ 1.8k Unknown May 10, 2026

LLM Engineering

RepEng: Steering Language Models in Seconds Without Fine-Tuning

By Rob Ragan ★ 724 Unknown May 10, 2026

LLM Engineering

LLMFuzzer: Security Testing for the Application-LLM Boundary

By Rob Ragan ★ 348 Unknown May 10, 2026

LLM Engineering

Inside pallms: A Security Arsenal for Breaking LLM Guardrails

By Rob Ragan ★ 135 Unknown May 10, 2026

LLM Engineering

Guidance: Programming with LLMs Like They're Regular Expressions

By Rob Ragan ★ 21.4k Unknown May 10, 2026

LLM Engineering

SGLang: How RadixAttention and Prefix Caching Achieve 5x Faster LLM Inference

By Rob Ragan ★ 27.6k Unknown May 10, 2026

LLM Engineering

Medusa: Accelerating LLM Inference by Predicting Multiple Tokens in Parallel

By Rob Ragan ★ 2.7k Unknown May 10, 2026

LLM Engineering

mergekit: Combining LLMs Without Training by Operating in Weight Space

By Rob Ragan ★ 7.1k Unknown May 10, 2026

LLM Engineering

Building a Prompt Injection Firewall: Inside Vigil's Multi-Layer Defense System

By Rob Ragan ★ 475 Unknown May 9, 2026

LLM Engineering

How GPT-2 Leaks Its Training Data: A Deep Dive into Language Model Memorization

By Rob Ragan ★ 196 Unknown May 9, 2026

LLM Engineering

Inside Microsoft's Responsible AI Toolbox: A Widget Architecture for Model Accountability

By Rob Ragan ★ 1.8k Unknown May 9, 2026

LLM Engineering

BishopFox/llm-testing-findings: The Missing Standard for Documenting AI Security Vulnerabilities

LitGPT: The Zero-Abstraction Framework for Production LLM Training

getML: The C++ Engine That Makes Feature Engineering on Relational Data 1000x Faster

Weaponizing Machine Learning Models: How Pickle Deserialization Turns TensorFlow into a Trojan Horse

Inside GCG: The Gradient-Based Attack That Broke LLM Alignment

AutoRedTeam: Training Language Models to Attack Other Language Models

MiniHF: Building Domain-Specific Language Models Through Constitutional AI and Tree Search

Zep: Why Temporal Knowledge Graphs Beat Vector Databases for AI Agent Memory

Red-Teaming LLMs with Systematic Prompt Perturbation: Inside Fiddler Auditor

How Large Language Models Are Learning to Think in Graphs: A Research Taxonomy

Running Mixtral-8x7B on Consumer Hardware: Expert Offloading and Mixed Quantization

Mangio-RVC-Fork: When Voice Conversion Meets Ensemble Pitch Detection

Axolotl: The Config-Driven LLM Fine-Tuning Framework Racing Ahead of Research

LLM Sherpa: How Smart Chunking Fixes RAG's Biggest Problem

RepEng: Steering Language Models in Seconds Without Fine-Tuning

LLMFuzzer: Security Testing for the Application-LLM Boundary

Inside pallms: A Security Arsenal for Breaking LLM Guardrails

Guidance: Programming with LLMs Like They're Regular Expressions

SGLang: How RadixAttention and Prefix Caching Achieve 5x Faster LLM Inference

Medusa: Accelerating LLM Inference by Predicting Multiple Tokens in Parallel

mergekit: Combining LLMs Without Training by Operating in Weight Space

Building a Prompt Injection Firewall: Inside Vigil's Multi-Layer Defense System

How GPT-2 Leaks Its Training Data: A Deep Dive into Language Model Memorization

Inside Microsoft's Responsible AI Toolbox: A Widget Architecture for Model Accountability