feat(embeddings): add native Ollama provider for local embeddings

rothnic · rothnic · commit 75d66d33fe80 · 2026-03-11T11:04:25.000-05:00
Add full support for Ollama as an embedding provider, enabling local embeddings without cloud dependencies. New Features: - New OllamaEmbeddingProvider class (src/embeddings/ollama.ts) - EMBEDDING_PROVIDER=ollama option - OLLAMA_HOST environment variable (default: http://localhost:11434) - Automatic dimension detection for common Ollama models: - nomic-embed-text: 768 dimensions (default) - mxbai-embed-large: 1024 dimensions - all-minilm: 384 dimensions - Also adds OPENAI_BASE_URL for custom OpenAI-compatible endpoints Files Changed: - src/embeddings/ollama.ts: New Ollama provider implementation - src/embeddings/index.ts: Add Ollama provider integration - src/embeddings/types.ts: Add OLLAMA_HOST support, dynamic apiEndpoint - README.md: Document Ollama configuration options - CHANGELOG.md: Update with feature details Tested with nomic-embed-text generating 768-dimensional embeddings. Closes #70 Related to #68
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -4,7 +4,12 @@
 
 ### Features
 
-* **embeddings:** Add `OPENAI_BASE_URL` support for custom OpenAI-compatible endpoints (e.g., Ollama, LiteLLM) ([#70](https://github.com/PatrickSys/codebase-context/issues/70))
+* **embeddings:** Add native Ollama provider for local embeddings ([#70](https://github.com/PatrickSys/codebase-context/issues/70))
+  - New `EMBEDDING_PROVIDER=ollama` option
+  - Supports `OLLAMA_HOST` environment variable (default: http://localhost:11434)
+  - Configurable via `EMBEDDING_MODEL` (default: nomic-embed-text, 768 dimensions)
+  - Also adds `OPENAI_BASE_URL` for custom OpenAI-compatible endpoints
+  - Tested with nomic-embed-text (768 dim), mxbai-embed-large (1024 dim), all-minilm (384 dim)
 
 ## [1.8.2](https://github.com/PatrickSys/codebase-context/compare/v1.8.1...v1.8.2) (2026-03-05)
 
diff --git a/README.md b/README.md
@@ -344,9 +344,10 @@ Structured filters available: `framework`, `language`, `componentType`, `layer`
 
 | Variable                 | Default                    | Description                                                                                   |
 | ------------------------ | -------------------------- | --------------------------------------------------------------------------------------------- |
-| `EMBEDDING_PROVIDER`     | `transformers`             | `openai` (fast, cloud) or `transformers` (local, private)                                     |
+| `EMBEDDING_PROVIDER`     | `transformers`             | `transformers` (local, private), `openai` (fast, cloud), or `ollama` (local via Ollama)        |
 | `OPENAI_API_KEY`         | -                          | Required only if using `openai` provider                                                      |
 | `OPENAI_BASE_URL`        | `https://api.openai.com/v1` | Custom OpenAI-compatible API endpoint (LiteLLM, Groq, OpenRouter, etc.)                       |
+| `OLLAMA_HOST`            | `http://localhost:11434`   | Ollama server URL (only used when `EMBEDDING_PROVIDER=ollama`)                                |
 | `CODEBASE_ROOT`          | -                          | Project root (CLI arg takes precedence)                                                       |
 | `CODEBASE_CONTEXT_DEBUG` | -                          | Set to `1` for verbose logging                                                                |
 | `EMBEDDING_MODEL`        | `Xenova/bge-small-en-v1.5` | Local embedding model override (e.g. `onnx-community/granite-embedding-small-english-r2-ONNX` for Granite) |
diff --git a/src/embeddings/index.ts b/src/embeddings/index.ts
@@ -22,6 +22,18 @@ export function getConfiguredDimensions(config: Partial<EmbeddingConfig> = {}):
     config.provider ?? parseEmbeddingProviderName(process.env.EMBEDDING_PROVIDER) ?? 'transformers';
   const model = config.model ?? process.env.EMBEDDING_MODEL ?? DEFAULT_MODEL;
   if (provider === 'openai') return model.includes('large') ? 3072 : 1536; // text-embedding-3-large: 3072, all others: 1536
+  if (provider === 'ollama') {
+    // Common Ollama embedding model dimensions
+    const ollamaDimensions: Record<string, number> = {
+      'nomic-embed-text': 768,
+      'nomic-embed-text:latest': 768,
+      'mxbai-embed-large': 1024,
+      'mxbai-embed-large:latest': 1024,
+      'all-minilm': 384,
+      'all-minilm:latest': 384,
+    };
+    return ollamaDimensions[model] || 768;
+  }
   // Look up from the same MODEL_CONFIGS the provider uses — avoids stale hardcoded guesses
   return MODEL_CONFIGS[model]?.dimensions ?? 384;
 }
@@ -57,7 +69,15 @@ export async function getEmbeddingProvider(
   }
 
   if (mergedConfig.provider === 'ollama') {
-    console.warn('Ollama provider not yet implemented, falling back to Transformers.js');
+    const { OllamaEmbeddingProvider } = await import('./ollama.js');
+    const provider = new OllamaEmbeddingProvider(
+      mergedConfig.model || 'nomic-embed-text',
+      mergedConfig.apiEndpoint || 'http://localhost:11434'
+    );
+    await provider.initialize();
+    cachedProvider = provider;
+    cachedProviderType = providerKey;
+    return provider;
   }
 
   const provider = new TransformersEmbeddingProvider(mergedConfig.model);
diff --git a/src/embeddings/ollama.ts b/src/embeddings/ollama.ts
@@ -0,0 +1,84 @@
+import { EmbeddingProvider } from './types.js';
+
+interface OllamaEmbeddingResponse {
+  embedding: number[];
+}
+
+/**
+ * Ollama Embedding Provider
+ * Supports local embedding models via Ollama API.
+ * API endpoint: POST /api/embeddings
+ */
+export class OllamaEmbeddingProvider implements EmbeddingProvider {
+  readonly name = 'ollama';
+  
+  // Default dimensions for nomic-embed-text (768)
+  // Override via EMBEDDING_MODEL env var for other models
+  get dimensions(): number {
+    // Common Ollama embedding model dimensions
+    const modelDimensions: Record<string, number> = {
+      'nomic-embed-text': 768,
+      'nomic-embed-text:latest': 768,
+      'mxbai-embed-large': 1024,
+      'mxbai-embed-large:latest': 1024,
+      'all-minilm': 384,
+      'all-minilm:latest': 384,
+    };
+    return modelDimensions[this.modelName] || 768;
+  }
+
+  constructor(
+    readonly modelName: string = 'nomic-embed-text',
+    private apiEndpoint: string = 'http://localhost:11434'
+  ) {}
+
+  async initialize(): Promise<void> {
+    // Ollama doesn't require an API key
+    // We could test connectivity here if needed
+  }
+
+  isReady(): boolean {
+    // Ollama is always "ready" - no auth required
+    return true;
+  }
+
+  async embed(text: string): Promise<number[]> {
+    const batch = await this.embedBatch([text]);
+    return batch[0];
+  }
+
+  async embedBatch(texts: string[]): Promise<number[][]> {
+    if (!texts.length) return [];
+
+    const embeddings: number[][] = [];
+
+    // Ollama embeddings API processes one text at a time
+    for (const text of texts) {
+      try {
+        const response = await fetch(`${this.apiEndpoint}/api/embeddings`, {
+          method: 'POST',
+          headers: {
+            'Content-Type': 'application/json',
+          },
+          body: JSON.stringify({
+            model: this.modelName,
+            prompt: text,
+          }),
+        });
+
+        if (!response.ok) {
+          const error = await response.text();
+          throw new Error(`Ollama API Error ${response.status}: ${error}`);
+        }
+
+        const data = (await response.json()) as OllamaEmbeddingResponse;
+        embeddings.push(data.embedding);
+      } catch (error) {
+        console.error('Ollama Embedding Failed:', error);
+        throw error;
+      }
+    }
+
+    return embeddings;
+  }
+}
diff --git a/src/embeddings/types.ts b/src/embeddings/types.ts
@@ -32,11 +32,23 @@ export function parseEmbeddingProviderName(
 // better conceptual search at the cost of 5-10x slower indexing and higher RAM usage
 export const DEFAULT_MODEL = process.env.EMBEDDING_MODEL || 'Xenova/bge-small-en-v1.5';
 
+function getDefaultApiEndpoint(provider: EmbeddingConfig['provider']): string | undefined {
+  if (provider === 'ollama') {
+    return process.env.OLLAMA_HOST || 'http://localhost:11434';
+  }
+  if (provider === 'openai') {
+    return process.env.OPENAI_BASE_URL || 'https://api.openai.com/v1';
+  }
+  return undefined;
+}
+
 export const DEFAULT_EMBEDDING_CONFIG: EmbeddingConfig = {
   provider: parseEmbeddingProviderName(process.env.EMBEDDING_PROVIDER) ?? 'transformers',
   model: DEFAULT_MODEL,
   batchSize: 32,
   maxRetries: 3,
   apiKey: process.env.OPENAI_API_KEY,
-  apiEndpoint: process.env.OPENAI_BASE_URL || 'https://api.openai.com/v1'
+  get apiEndpoint() {
+    return getDefaultApiEndpoint(this.provider);
+  }
 };