(OpenAI API) OpenAPI Embedding
1. Models
text-embedding-3-small
- 가성비 좋고 속도 빠른 기본 모델
- 대부분의 검색/분류/추천에는 이걸 먼저 쓴다고 보면 됨.
text-embedding-3-large
- 더 높은 성능, 다국어 이해력 강화
- 랭킹/고품질 검색 등에 적합
2. Embeddings 기본 호출 방식
from openai import OpenAI
client = OpenAI()
response = client.embeddings.create(
model="text-embedding-3-small",
input=[
"Hello, world!",
"This is another sentence."
],
)
emb1 = response.data[0].embedding # 리스트[float]
emb2 = response.data[1].embedding
print(len(emb1)) # 보통 1536 등 차원 수
- input에 문자열 하나 or 여러 개 전달
response.data[i].embedding이 바로 벡터 (리스트[float])- 이 벡터를 벡터DB, Faiss, Annoy, Elastic, Postgres pgvector 등에 저장해서 사용