feat: add pinecone support to create llama (#555)

cfdd6db5 · Thuc Pham · GitHub · d4eda9f3 · cfdd6db5 · cfdd6db5
Unverified Commit cfdd6db5 authored 1 year ago by Thuc Pham Committed by GitHub 1 year ago
--- a/.changeset/happy-monkeys-cross.md
+++ b/.changeset/happy-monkeys-cross.md
+---
+"llamaindex": patch
+---
+
+fix: update pinecone vector store
--- a/.changeset/pink-tools-look.md
+++ b/.changeset/pink-tools-look.md
+---
+"create-llama": patch
+---
+
+feat: add pinecone support to create llama
--- a/packages/core/package.json
+++ b/packages/core/package.json
@@ -8,7 +8,7 @@
    "@datastax/astra-db-ts": "^0.1.4",
    "@mistralai/mistralai": "^0.0.10",
    "@notionhq/client": "^2.2.14",
-    "@pinecone-database/pinecone": "^1.1.3",
+    "@pinecone-database/pinecone": "^2.0.1",
    "@qdrant/js-client-rest": "^1.7.0",
    "@xenova/transformers": "^2.15.0",
    "assemblyai": "^4.2.2",

--- a/packages/core/src/storage/vectorStore/PineconeVectorStore.ts
+++ b/packages/core/src/storage/vectorStore/PineconeVectorStore.ts
@@ -6,7 +6,7 @@ import {
  VectorStoreQueryResult,
 } from "./types";

-import { BaseNode, Document, Metadata, MetadataMode } from "../../Node";
+import { BaseNode, Metadata } from "../../Node";
 import { GenericFileSystem } from "../FileSystem";

 import {
@@ -15,6 +15,7 @@ import {
  Pinecone,
  ScoredPineconeRecord,
 } from "@pinecone-database/pinecone";
+import { metadataDictToNode, nodeToMetadata } from "./utils";

 type PineconeParams = {
  indexName?: string;
@@ -155,12 +156,18 @@ export class PineconeVectorStore implements VectorStore {
    const rows = Object.values(records.records);

    const nodes = rows.map((row) => {
-      return new Document({
-        id_: row.id,
-        text: this.textFromResultRow(row),
-        metadata: this.metaWithoutText(row.metadata),
-        embedding: row.values,
+      const metadata = this.metaWithoutText(row.metadata);
+      const text = this.textFromResultRow(row);
+      const node = metadataDictToNode(metadata, {
+        fallback: {
+          id: row.id,
+          text,
+          metadata,
+          embedding: row.values,
+        },
      });
+      node.setContent(text);
+      return node;
    });

    const ret = {
@@ -207,14 +214,10 @@ export class PineconeVectorStore implements VectorStore {

  nodeToRecord(node: BaseNode<Metadata>) {
    let id: any = node.id_.length ? node.id_ : null;
-    let meta: any = node.metadata || {};
-    meta.create_date = new Date();
-    meta.text = node.getContent(MetadataMode.EMBED);
-
    return {
      id: id,
      values: node.getEmbedding(),
-      metadata: meta,
+      metadata: nodeToMetadata(node),
    };
  }
 }
--- a/packages/create-llama/helpers/types.ts
+++ b/packages/create-llama/helpers/types.ts
@@ -4,7 +4,7 @@ export type TemplateType = "simple" | "streaming" | "community" | "llamapack";
 export type TemplateFramework = "nextjs" | "express" | "fastapi";
 export type TemplateEngine = "simple" | "context";
 export type TemplateUI = "html" | "shadcn";
-export type TemplateVectorDB = "none" | "mongo" | "pg";
+export type TemplateVectorDB = "none" | "mongo" | "pg" | "pinecone";
 export type TemplatePostInstallAction = "none" | "dependencies" | "runApp";
 export type TemplateDataSource = {
  type: TemplateDataSourceType;

--- a/packages/create-llama/questions.ts
+++ b/packages/create-llama/questions.ts
@@ -89,6 +89,7 @@ const getVectorDbChoices = (framework: TemplateFramework) => {
    },
    { title: "MongoDB", value: "mongo" },
    { title: "PostgreSQL", value: "pg" },
+    { title: "Pinecone", value: "pinecone" },
  ];

  const vectordbLang = framework === "fastapi" ? "python" : "typescript";

--- a/packages/create-llama/templates/components/vectordbs/python/pinecone/__init__.py
+++ b/packages/create-llama/templates/components/vectordbs/python/pinecone/__init__.py
--- a/packages/create-llama/templates/components/vectordbs/python/pinecone/constants.py
+++ b/packages/create-llama/templates/components/vectordbs/python/pinecone/constants.py
+DATA_DIR = "data"  # directory containing the documents to index
+CHUNK_SIZE = 512
+CHUNK_OVERLAP = 20
--- a/packages/create-llama/templates/components/vectordbs/python/pinecone/context.py
+++ b/packages/create-llama/templates/components/vectordbs/python/pinecone/context.py
+from llama_index import ServiceContext
+
+from app.context import create_base_context
+from app.engine.constants import CHUNK_SIZE, CHUNK_OVERLAP
+
+
+def create_service_context():
+    base = create_base_context()
+    return ServiceContext.from_defaults(
+        llm=base.llm,
+        embed_model=base.embed_model,
+        chunk_size=CHUNK_SIZE,
+        chunk_overlap=CHUNK_OVERLAP,
+    )
--- a/packages/create-llama/templates/components/vectordbs/python/pinecone/generate.py
+++ b/packages/create-llama/templates/components/vectordbs/python/pinecone/generate.py
+from dotenv import load_dotenv
+
+load_dotenv()
+import os
+import logging
+from llama_index.vector_stores import PineconeVectorStore
+
+from app.engine.constants import DATA_DIR
+from app.engine.context import create_service_context
+from app.engine.loader import get_documents
+
+
+from llama_index import (
+    SimpleDirectoryReader,
+    VectorStoreIndex,
+    StorageContext,
+)
+
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger()
+
+
+def generate_datasource(service_context):
+    logger.info("Creating new index")
+    # load the documents and create the index
+    documents = get_documents()
+    store = PineconeVectorStore(
+        api_key=os.environ["PINECONE_API_KEY"],
+        index_name=os.environ["PINECONE_INDEX_NAME"],
+        environment=os.environ["PINECONE_ENVIRONMENT"],
+    )
+    storage_context = StorageContext.from_defaults(vector_store=store)
+    VectorStoreIndex.from_documents(
+        documents,
+        service_context=service_context,
+        storage_context=storage_context,
+        show_progress=True,  # this will show you a progress bar as the embeddings are created
+    )
+    logger.info(
+        f"Successfully created embeddings and save to your Pinecone index {os.environ['PINECONE_INDEX_NAME']}"
+    )
+
+
+if __name__ == "__main__":
+    generate_datasource(create_service_context())
--- a/packages/create-llama/templates/components/vectordbs/python/pinecone/index.py
+++ b/packages/create-llama/templates/components/vectordbs/python/pinecone/index.py
+import logging
+import os
+
+from llama_index import (
+    VectorStoreIndex,
+)
+from llama_index.vector_stores import PineconeVectorStore
+
+from app.engine.context import create_service_context
+
+
+def get_index():
+    service_context = create_service_context()
+    logger = logging.getLogger("uvicorn")
+    logger.info("Connecting to index from Pinecone...")
+    store = PineconeVectorStore(
+        api_key=os.environ["PINECONE_API_KEY"],
+        index_name=os.environ["PINECONE_INDEX_NAME"],
+        environment=os.environ["PINECONE_ENVIRONMENT"],
+    )
+    index = VectorStoreIndex.from_vector_store(store, service_context)
+    logger.info("Finished connecting to index from Pinecone.")
+    return index
--- a/packages/create-llama/templates/components/vectordbs/typescript/pinecone/generate.mjs
+++ b/packages/create-llama/templates/components/vectordbs/typescript/pinecone/generate.mjs
+/* eslint-disable turbo/no-undeclared-env-vars */
+import * as dotenv from "dotenv";
+import {
+  PineconeVectorStore,
+  SimpleDirectoryReader,
+  VectorStoreIndex,
+  storageContextFromDefaults,
+} from "llamaindex";
+import { STORAGE_DIR, checkRequiredEnvVars } from "./shared.mjs";
+
+dotenv.config();
+
+async function loadAndIndex() {
+  // load objects from storage and convert them into LlamaIndex Document objects
+  const documents = await new SimpleDirectoryReader().loadData({
+    directoryPath: STORAGE_DIR,
+  });
+
+  // create vector store
+  const vectorStore = new PineconeVectorStore();
+
+  // create index from all the Documentss and store them in Pinecone
+  console.log("Start creating embeddings...");
+  const storageContext = await storageContextFromDefaults({ vectorStore });
+  await VectorStoreIndex.fromDocuments(documents, { storageContext });
+  console.log(
+    "Successfully created embeddings and save to your Pinecone index.",
+  );
+}
+
+(async () => {
+  checkRequiredEnvVars();
+  await loadAndIndex();
+  console.log("Finished generating storage.");
+})();
--- a/packages/create-llama/templates/components/vectordbs/typescript/pinecone/index.ts
+++ b/packages/create-llama/templates/components/vectordbs/typescript/pinecone/index.ts
+/* eslint-disable turbo/no-undeclared-env-vars */
+import {
+  ContextChatEngine,
+  LLM,
+  PineconeVectorStore,
+  VectorStoreIndex,
+  serviceContextFromDefaults,
+} from "llamaindex";
+import { CHUNK_OVERLAP, CHUNK_SIZE, checkRequiredEnvVars } from "./shared.mjs";
+
+async function getDataSource(llm: LLM) {
+  checkRequiredEnvVars();
+  const serviceContext = serviceContextFromDefaults({
+    llm,
+    chunkSize: CHUNK_SIZE,
+    chunkOverlap: CHUNK_OVERLAP,
+  });
+  const store = new PineconeVectorStore();
+  return await VectorStoreIndex.fromVectorStore(store, serviceContext);
+}
+
+export async function createChatEngine(llm: LLM) {
+  const index = await getDataSource(llm);
+  const retriever = index.asRetriever({ similarityTopK: 5 });
+  return new ContextChatEngine({
+    chatModel: llm,
+    retriever,
+  });
+}
--- a/packages/create-llama/templates/components/vectordbs/typescript/pinecone/shared.mjs
+++ b/packages/create-llama/templates/components/vectordbs/typescript/pinecone/shared.mjs
+export const STORAGE_DIR = "./data";
+export const CHUNK_SIZE = 512;
+export const CHUNK_OVERLAP = 20;
+
+const REQUIRED_ENV_VARS = ["PINECONE_ENVIRONMENT", "PINECONE_API_KEY"];
+
+export function checkRequiredEnvVars() {
+  const missingEnvVars = REQUIRED_ENV_VARS.filter((envVar) => {
+    return !process.env[envVar];
+  });
+
+  if (missingEnvVars.length > 0) {
+    console.log(
+      `The following environment variables are required but missing: ${missingEnvVars.join(
+        ", ",
+      )}`,
+    );
+    throw new Error(
+      `Missing environment variables: ${missingEnvVars.join(", ")}`,
+    );
+  }
+}
--- a/pnpm-lock.yaml
+++ b/pnpm-lock.yaml
@@ -178,8 +178,8 @@ importers:
        specifier: ^2.2.14
        version: 2.2.14
      '@pinecone-database/pinecone':
-        specifier: ^1.1.3
-        version: 1.1.3
+        specifier: ^2.0.1
+        version: 2.0.1
      '@qdrant/js-client-rest':
        specifier: ^1.7.0
        version: 1.7.0(typescript@5.3.3)
@@ -3447,6 +3447,16 @@ packages:
      encoding: 0.1.13
    dev: false
  
+  /@pinecone-database/pinecone@2.0.1:
+    resolution: {integrity: sha512-a1ejzrqdSQ2yW+9QUi2TVlKwYUbrvGH+QH6POJhITyaOz9ANE+EhXqToC9af93Ctzq9n87+bOUvBvewLeW++Mw==}
+    engines: {node: '>=14.0.0'}
+    dependencies:
+      '@sinclair/typebox': 0.29.6
+      ajv: 8.12.0
+      cross-fetch: 3.1.8(encoding@0.1.13)
+      encoding: 0.1.13
+    dev: false
+
  /@pkgjs/parseargs@0.11.0:
    resolution: {integrity: sha512-+1VkjdD0QBLPodGrJUeqarH8VAIvQODIbwh9XpP5Syisf7YoQgsJKPNFoqqLQlu+VQ/tVSshMR6loPMn8U+dPg==}
    engines: {node: '>=14'}
@@ -10213,55 +10223,6 @@ packages:
      wrap-ansi: 9.0.0
    dev: true
  
-  /llamaindex@0.1.9(typescript@5.3.3):
-    resolution: {integrity: sha512-MAMGV5MXXcJ4rSV2kqCZENf7B+q1zTwPnHpnHJgEiEzP5+djNdLmbz/zaCmxpB8wgNNLUem9iJt53iwDBJ4ZBA==}
-    engines: {node: '>=18.0.0'}
-    dependencies:
-      '@anthropic-ai/sdk': 0.12.4
-      '@datastax/astra-db-ts': 0.1.4
-      '@mistralai/mistralai': 0.0.10
-      '@notionhq/client': 2.2.14
-      '@pinecone-database/pinecone': 1.1.3
-      '@qdrant/js-client-rest': 1.7.0(typescript@5.3.3)
-      '@xenova/transformers': 2.14.1
-      assemblyai: 4.2.1
-      chromadb: 1.7.3(openai@4.26.0)
-      file-type: 18.7.0
-      js-tiktoken: 1.0.8
-      lodash: 4.17.21
-      mammoth: 1.6.0
-      md-utils-ts: 2.0.0
-      mongodb: 6.3.0
-      notion-md-crawler: 0.0.2
-      openai: 4.26.0
-      papaparse: 5.4.1
-      pathe: 1.1.2
-      pdf2json: 3.0.5
-      pg: 8.11.3
-      pgvector: 0.1.7
-      portkey-ai: 0.1.16
-      rake-modified: 1.0.8
-      replicate: 0.25.2
-      string-strip-html: 13.4.5
-      wink-nlp: 1.14.3
-    transitivePeerDependencies:
-      - '@aws-sdk/credential-providers'
-      - '@google/generative-ai'
-      - '@mongodb-js/zstd'
-      - bufferutil
-      - cohere-ai
-      - debug
-      - encoding
-      - gcp-metadata
-      - kerberos
-      - mongodb-client-encryption
-      - pg-native
-      - snappy
-      - socks
-      - typescript
-      - utf-8-validate
-    dev: false
-
  /load-yaml-file@0.2.0:
    resolution: {integrity: sha512-OfCBkGEw4nN6JLtgRidPX6QxjBQGQf72q3si2uvqyFEMbycSFFHwAZeXx6cJgFM9wmLrf9zBwCP3Ivqa+LLZPw==}
    engines: {node: '>=6'}
@@ -12062,6 +12023,8 @@ packages:
    resolution: {integrity: sha512-Un1yLbSlk/zfwrltgguskExIioXZlFSFwsyXU0cnBorLywbTbcdzmJJEebh+U2cFCtR7y8nDs5lPHAe7ldxjZg==}
    engines: {node: '>=18.12.1', npm: '>=8.19.2'}
    hasBin: true
+    dependencies:
+      '@xmldom/xmldom': 0.8.10
    dev: false
    bundledDependencies:
      - '@xmldom/xmldom'