Библиотека Facebook для эффективного поиска похожих векторов и их кластеризации. Поддерживает миллиарды векторов, ускорение на GPU и различные типы индексов (Flat, IVF, HNSW). Используется для быстрого k-NN поиска, крупномасштабного векторного поиска или когда требуется чистый поиск по сходству без метаданных. Лучший выбор для высокопроизводительных приложений.

Skill metadata¶

|
---|---
Source| Опционально — установка: hermes skills install official/mlops/faiss
Path| optional-skills/mlops/faiss
Версия| 1.0.0
Автор| Orchestra Research
Лицензия| MIT
Зависимости| faiss-cpu, faiss-gpu, numpy
Теги| RAG, FAISS, Similarity Search, Vector Search, Facebook AI, GPU Acceleration, Billion-Scale, K-NN, HNSW, High Performance, Large Scale

Reference: full SKILL.md¶

info Ниже приведено полное определение навыка, которое Hermes загружает при его активации. Это то, что агент видит в качестве инструкции, когда навык активен.

FAISS - Efficient Similarity Search¶

Библиотека Facebook AI для поиска похожих векторов в миллиардных масштабах.

When to use FAISS¶

Используйте FAISS когда: * Требуется быстрый поиск по сходству на больших наборах векторных данных (миллионы/миллиарды) * Требуется ускорение на GPU * Чистое векторное сходство (без фильтрации по метаданным) * Критичны высокая пропускная способность и низкая задержка * Пакетная/офлайн обработка эмбеддингов

Показатели: * 31,700+ звёзд на GitHub * Meta/Facebook AI Research * Работает с миллиардами векторов * C++ с биндингами для Python

Альтернативы: * Chroma/Pinecone: требуется фильтрация по метаданным * Weaviate: нужны полноценные возможности базы данных * Annoy: проще, меньше возможностей

Quick start¶

Installation¶

[code] # Только CPU
pip install faiss-cpu

# Поддержка GPU  
pip install faiss-gpu

[/code]

Basic usage¶

[code] import faiss import numpy as np

# Создание примера данных (1000 векторов, 128 измерений)
d = 128
nb = 1000
vectors = np.random.random((nb, d)).astype('float32')

# Создание индекса
index = faiss.IndexFlatL2(d)  # L2 расстояние
index.add(vectors)             # Добавление векторов

# Поиск
k = 5  # Найти 5 ближайших соседей
query = np.random.random((1, d)).astype('float32')
distances, indices = index.search(query, k)

print(f"Nearest neighbors: {indices}")
print(f"Distances: {distances}")

[/code]

Index types¶

1. Flat (exact search)¶

[code] # L2 (евклидово) расстояние index = faiss.IndexFlatL2(d)

# Скалярное произведение (косинусное сходство, если векторы нормализованы)
index = faiss.IndexFlatIP(d)

# Самый медленный, самый точный

[/code]

2. IVF (inverted file) - Fast approximate¶

[code] # Создание квантователя quantizer = faiss.IndexFlatL2(d)

# IVF индекс со 100 кластерами
nlist = 100
index = faiss.IndexIVFFlat(quantizer, d, nlist)

# Обучение на данных
index.train(vectors)

# Добавление векторов
index.add(vectors)

# Поиск (nprobe = количество кластеров для поиска)
index.nprobe = 10
distances, indices = index.search(query, k)

[/code]

3. HNSW (Hierarchical NSW) - Best quality/speed¶

[code] # HNSW индекс M = 32 # Количество связей на уровень index = faiss.IndexHNSWFlat(d, M)

# Обучение не требуется
index.add(vectors)

# Поиск
distances, indices = index.search(query, k)

[/code]

4. Product Quantization - Memory efficient¶

[code] # PQ уменьшает использование памяти в 16–32 раза m = 8 # Количество субквантователей nbits = 8 index = faiss.IndexPQ(d, m, nbits)

# Обучение и добавление
index.train(vectors)
index.add(vectors)

[/code]

Save and load¶

[code] # Сохранение индекса faiss.write_index(index, "large.index")

# Загрузка индекса
index = faiss.read_index("large.index")

# Продолжение использования
distances, indices = index.search(query, k)

[/code]

GPU acceleration¶

[code] # Один GPU res = faiss.StandardGpuResources() index_cpu = faiss.IndexFlatL2(d) index_gpu = faiss.index_cpu_to_gpu(res, 0, index_cpu) # GPU 0

# Несколько GPU
index_gpu = faiss.index_cpu_to_all_gpus(index_cpu)

# В 10–100 раз быстрее CPU

[/code]

LangChain integration¶

[code] from langchain_community.vectorstores import FAISS from langchain_openai import OpenAIEmbeddings

# Создание FAISS векторного хранилища
vectorstore = FAISS.from_documents(docs, OpenAIEmbeddings())

# Сохранение
vectorstore.save_local("faiss_index")

# Загрузка
vectorstore = FAISS.load_local(
    "faiss_index",
    OpenAIEmbeddings(),
    allow_dangerous_deserialization=True
)

# Поиск
results = vectorstore.similarity_search("query", k=5)

[/code]

LlamaIndex integration¶

[code] from llama_index.vector_stores.faiss import FaissVectorStore import faiss

# Создание FAISS индекса
d = 1536
faiss_index = faiss.IndexFlatL2(d)

vector_store = FaissVectorStore(faiss_index=faiss_index)

[/code]

Best practices¶

Выбирайте правильный тип индекса - Flat для <10K, IVF для 10K–1M, HNSW для качества
Нормализуйте для косинусного сходства - используйте IndexFlatIP с нормализованными векторами
Используйте GPU для больших наборов данных - в 10–100 раз быстрее
Сохраняйте обученные индексы - обучение требует больших вычислительных ресурсов
Настраивайте nprobe/ef_search - баланс между скоростью и точностью
Контролируйте память - используйте PQ для больших наборов данных
Пакетные запросы - лучшее использование GPU

Performance¶

Index Type	Build Time	Search Time	Memory	Accuracy
Flat	Быстро	Медленно	Высокая	100%
IVF	Средне	Быстро	Средняя	95–99%
HNSW	Медленно	Быстрейший	Высокая	99%
PQ	Средне	Быстро	Низкая	90–95%
## Resources
* GitHub : https://github.com/facebookresearch/faiss ⭐ 31,700+
* Wiki : https://github.com/facebookresearch/faiss/wiki
* License : MIT

Skill metadata
Reference: full SKILL.md
When to use FAISS
Quick start
- Installation
- Basic usage
Index types
Save and load
GPU acceleration
LangChain integration
LlamaIndex integration
Best practices
Performance
Resources

Skill metadata​¶

Reference: full SKILL.md​¶

FAISS - Efficient Similarity Search¶

When to use FAISS​¶

Quick start​¶

Installation​¶

Basic usage​¶

Index types​¶

1. Flat (exact search)​¶

2. IVF (inverted file) - Fast approximate​¶

3. HNSW (Hierarchical NSW) - Best quality/speed​¶

4. Product Quantization - Memory efficient​¶

Save and load​¶

GPU acceleration​¶

LangChain integration​¶

LlamaIndex integration​¶

Best practices​¶

Performance​¶

Skill metadata¶

Reference: full SKILL.md¶

When to use FAISS¶

Quick start¶

Installation¶

Basic usage¶

Index types¶

1. Flat (exact search)¶

2. IVF (inverted file) - Fast approximate¶

3. HNSW (Hierarchical NSW) - Best quality/speed¶

4. Product Quantization - Memory efficient¶

Save and load¶

GPU acceleration¶

LangChain integration¶

LlamaIndex integration¶

Best practices¶

Performance¶