English

Ghid practic pentru HubSpot Data Hub și Google Gemini AI File Search (2025)

Ghid practic pentru HubSpot Data Hub și Google Gemini AI File Search (2025)
12.11.2025

Datele companiilor se regăsesc adesea în proiecte și arhive de date neconectate între ele, de la e-mailuri la ERP, CRM, website etc. În același timp, aproape toate companiile folosesc un CRM și interacționează cu AI precum ChatGPT, însă aplicarea inteligenței artificiale pe datele private de afaceri a rămas complexă și costisitoare.

În toamna lui 2025, HubSpot a introdus Data Hub, iar în noiembrie 2025, Google a lansat o versiune preliminară a File Search pentru API-ul Gemini. Împreună, acestea fac ca datele unificate și RAG-ul managed să devină cu adevărat practice pentru companii de dimensiuni medii. Acest articol vă oferă două ghiduri concise pentru a testa fiecare sistem, apoi arată cum să le combinați într-un singur flux de lucru bazat pe agenți AI.

Dar înainte de asta, trebuie menționat că a doua lansare a generat un interes enorm. Robin Ebers a surprins acest sentiment:




Partea 1: Unificarea datelor cu Data Hub

Pentru un sistem inteligent, sunt necesare date de încredere din toate sursele, chiar și pentru utilizatorii non-tehnici. Aceasta este problema pe care noul Data Hub de la HubSpot își propune să o rezolve. Modulul merge dincolo de simplele conexiuni între aplicații pentru a transforma CRM-ul în fundația de date pentru orice altceva.


Capacități cheie:

  • HubSpot Data Studio: Un mediu vizual extrem de capabil în care angajații non-tehnici pot combina datele din portalul HubSpot cu surse externe: pot explora seturi de date sau alte aplicații conectate pentru a crea noi seturi și oricâte rapoarte unificate.

HubSpot Data Studio Create Dataset
Figura 1: Fără a scrie cod, un manager de marketing poate acum să combine datele despre tranzacții cu datele financiare dintr-o sursă externă pentru a vizualiza unificat LTV-ul.


  • Curățarea datelor cu ajutorul AI: Sistemul include acum recomandări AI pentru a vă ajuta să formatați proprietățile, să corectați inconsecvențele și să mențineți igiena datelor în mod automat. Include, de asemenea, gestionarea duplicatelor în masă și un panou de bord pentru sănătatea datelor.

HubSpot Data Hub Smart Columns
Figura 2: Automatizați îmbogățirea datelor. AI-ul poate adăuga instantaneu informații lipsă, cum ar fi dimensiunea companiei sau industria, tuturor contactelor dvs., ceea ce face instantă segmentarea și analiza.


  • Sincronizare și automatizare avansată a datelor: Cu funcționalități precum Reverse ETL, puteți nu numai să aduceți date în HubSpot, ci și să exportați datele curate și unificate din HubSpot înapoi către alte sisteme critice, cum ar fi ERP-ul sau software-ul financiar. Nu uitați de integrarea deja existentă HubSpot - Google BigQuery (citiți mai multe în ghidul anterior al OPTI aici ➛)

HubSpot Data Studio Sources
Figura 3: Aduceți toate datele companiei dvs. în HubSpot CRM, indiferent unde se află.


Facilitățile de acest tip erau de obicei disponibile doar companiilor cu echipe interne de date, însă acum sunt oferite ca pachet HubSpot (în cloud, ca SaaS).

În ceea ce privește prețurile, în noiembrie 2025, acestea pornesc de la 700 $/lună cu un post de bază (core seat) pentru ediția Professional sau 2000 $/lună pentru ediția completă Enterprise (incluzând Custom Objects și integrare cu Data Warehouses, cum ar fi BigQuery)




Ghid practic: Primii pași în Data Hub

Iată o abordare în patru pași pentru a începe unificarea datelor.


Pasul 1: Auditați și conectați sursele cheie de date

Înainte de a sincroniza orice, cartografiați-vă datele. Întrebați: Unde se află cele mai critice date despre clienți? Acestea includ adesea platforma dvs. de e-commerce (de exemplu, Shopify), software-ul financiar (de exemplu, NetSuite) și CRM-urile anterioare.

  1. În HubSpot, navigați la Settings > Integrations > Connected Apps.

  2. Utilizați App Marketplace pentru a găsi și instala integrările native pentru sistemele dvs. cheie.

  3. În timpul configurării, autorizați conectarea și stabiliți mapările inițiale ale obiectelor (de exemplu, conectarea unui client Shopify la un contact HubSpot). Toate aceste legături trebuie să fie corecte pentru a crea o fundație de date solidă.


Pasul 2: Efectuați o curățare inițială a datelor

Acum, concentrați-vă pe datele deja existente în HubSpot. O bază de date curată și fără duplicate va fi ușor de întreținut, chiar și de către persoane non-tehnice.

  1. Navigați la Contacte și utilizați funcția Actions > Merge Duplicates. AI-ul HubSpot va sugera duplicate potențiale pe baza e-mailului, numelui și domeniului companiei.

  2. Creați o „Listă activă” de contacte cu probleme de formatare, cum ar fi Prenumele conține doar majuscule sau Numărul de telefon nu respectă un format standard.

  3. Utilizați fluxurile de lucru (Workflows) HubSpot pentru a standardiza aceste proprietăți. De exemplu, creați un flux de lucru care se declanșează atunci când un contact este adăugat la „lista de curățare” și utilizează acțiunea „Format Data” pentru a schimba textul în „Title Case” sau pentru a formata corect o dată.


Pasul 3: Creați prima sincronizare bidirecțională

Puterea noului Data Hub constă în sincronizarea bidirecțională. Un bun punct de plecare sunt platformele cele mai folosite de echipele de vânzări sau de suport.

  1. Accesați setările pentru aplicația conectată (de exemplu, Salesforce sau un alt CRM).

  2. Configurați o nouă regulă de sincronizare. Definiți declanșatorul și acțiunea. De exemplu: „Când stadiul ciclului de viață al unui Contact este actualizat la Client în HubSpot, actualizați înregistrarea corespunzătoare în celălalt sistem.”

  3. În mod crucial, configurați o regulă în sens invers: „Când o tranzacție este marcată ca Succes în instrumentul nostru de vânzări, actualizați înregistrarea tranzacției asociate în HubSpot și înscrieți contactul în fluxul de lucru 'Integrarea clientului nou'.” Veți avea astfel o conexiune vie, asigurând consistența datelor.


Pasul 4: Construiți o nouă vizualizare cu Data Studio

Aici se întâmplă magia Data Hub, permițându-vă să interogați seturi de date fără cunoștințe tehnice. Să creăm un raport care combină interacțiunea de marketing cu rezultatele vânzărilor.

  1. Navigați la Data Management > Data Studio.

  2. Faceți clic pe „Create dataset.

  3. Ca sursă primară, selectați Contacts (Contacte). Ca sursă secundară, selectați Deals (Tranzacții).
    HubSpot Create Data Set
    Figura 4: HubSpot va păstra toate seturile de date primare și secundare și le poate uni la cerere.




  4. Uniți-le pe baza ID-ului Tranzacției Asociate. Acum adăugați o altă sursă: datele platformei dvs. de advertising, pe care le-ați sincronizat în HubSpot, de exemplu, ca custom objects. Uniți aceste date pe baza adresei de e-mail a contactului.

  5. Acum puteți construi un raport care vizualizează ce campanii publicitare au adus lead-uri care s-au transformat în final în tranzacțiile cu cea mai mare valoare - o perspectivă unică, imposibil de realizat înainte fără un analist de date.

Așa cum spun chiar cei de la HubSpot:

„Când spunem că HubSpot unifică datele, ne referim la toate datele de afaceri ale companiei. Modulul este conceput pentru echipele care s-au săturat de exporturi manuale, integrări defecte și date care par să nu se potrivească niciodată.”

Aflați mai multe despre noile capabilități pe blogul oficial HubSpot ➛




Partea 2: Inteligență fundamentată cu Gemini File Search

Google File Search este un sistem gestionat (en. managed) de Generare Augmentată prin Regăsire (RAG). Mai simplu spus, puteți încărca documentele dvs.: manuale de produs, manuale de suport, studii de caz, politici de HR sau rapoarte financiare în API-ul Gemini. Apoi, îi adresați lui Gemini întrebări despre acestea în limbaj natural, iar AI-ul va respecta documentele pe care le-ați adăugat.

Gemini File Search
Figura 5: Imaginea oficială de anunț pentru File Search de la Google.


Singura programare implicată este conexiunea pentru a încărca fișierele și a adresa întrebări lui Gemini, după cum vedem mai jos.

Status (noiembrie 2025): File Search este o funcționalitate în previzualizare publică a API-ului Gemini. Încărcați fișiere prin API-ul Files, apoi le adăugați într-un Store (un container persistent pentru documentele dvs.) și interogați cu un model configurat cu File Search.


File Search deblochează:

  • RAG democratizat la un preț redus: În loc de investiții semnificative în baze de date vectoriale pentru RAG, simplele apeluri API înseamnă un cost scalabil și previzibil.


  • Expertiză internă: Construiți chatbot-uri care pot răspunde la întrebări foarte specifice pentru angajații dvs., cum ar fi „Care sunt protocoalele unui audit conform documentelor noastre de conformitate?”


  • Acuratețe: Fiecare răspuns generat de AI include metadate de citare care fac legătura cu documentul sursă exact și cu pasajul respectiv, pentru a permite verificarea. Le puteți afișa în aplicația dvs. frontend (cu puțină programare).


Pentru o previzualizare a secțiunii următoare, vedeți această diagramă pe care am creat-o pentru a ilustra cum ar arăta o afacere centrată pe File Search:

Diagramă - de la date la aplicații folosind HubSpot și File Search pentru afaceri
Figura 6: Fluxul de lucru este simplu: (1) Documentele dvs. de afaceri sunt ingerate (2) prin API-ul Files într-un depozit securizat File Search Store. (3) Acest lucru permite lui Gemini să alimenteze aplicații precum chatbot-uri interne și asistenți cu răspunsuri verificabile.


În ceea ce privește prețurile, postările din previzualizarea publică (noiembrie 2025) menționează 0,15 $/1 milion de tokenuri pentru indexarea inițială a fișierelor dvs. în Gemini, stocarea și generarea ulterioară fiind în prezent gratuite. Rețineți, o regulă generală este că 1 token înseamnă aproximativ 4 caractere.




Ghid practic: Primii pași cu API-ul File Search

Procesul de mai jos este orientat către programatori (cel puțin pentru moment), dar conectează în doar patru pași întreaga dvs. arhivă de documente la un AI puternic.


Pasul 1: Obțineți cheia API și configurați mediul

  1. Accesați Google AI Studio (ai.google.dev).

  2. În meniul din stânga, faceți clic pe Get API Key (Obțineți cheia API) și apoi pe Create API key in new project (Creați cheie API într-un proiect nou). Salvați această cheie în siguranță.

  3. Asigurați-vă că aveți Python instalat pe mașina dvs. Apoi, instalați biblioteca Google necesară rulând această comandă în terminalul dvs.:
    pip install -q google-generativeai



Pasul 2: Încărcați primul set de documente

Aceasta este pasul esențial pentru indexarea bazei de cunoștințe. Să presupunem că aveți un folder cu trei documente PDF: specificatii_produs.pdf, intrebari_frecvente_suport.pdf și report_draft.pdf.

Creați un script Python și adăugați următorul cod. Acesta va încărca fiecare fișier și va stoca datele de identificare returnate de API Gemini.


from google import genai
from google.genai import types
import time

client = genai.Client()

# 1) Creați un depozit File Search Store (container persistent)
store = client.file_search_stores.create(config={'display_name': 'my-reports-store'})

# 2) Încărcați + importați un fișier în depozit (numele va apărea în citări)
op = client.file_search_stores.upload_to_file_search_store(
    file="report_draft.pdf",
    file_search_store_name=store.name,
    config={'display_name': 'My Report Draft v1'}
)


Pasul 3: Așteptați procesarea


# 3) Așteptați finalizarea indexării (prin interogare repetată)
while not op.done:
    time.sleep(1)
    op = client.operations.get(op)

Personalizare avansată: API-ul suportă, de asemenea, chunking (încărcare în părți) și încărcări paralele.


Pasul 4: Adresați o întrebare și obțineți răspunsul și citările

Acum puteți interoga baza dvs. de cunoștințe.


# 4) Întrebați modelul prin File Search folosind depozitul creat
resp = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Realizează o sinteză a principalelor puncte din document cu 3 surse din datele companiei.",
    config=types.GenerateContentConfig(
        tools=[types.Tool(
            file_search=types.FileSearch(
                file_search_store_names=[store.name]
            )
        )]
    )
)

print(resp.text)

# Opțional: accesați metadatele de citare / grounding data pentru a le afișa vizual
print(resp.candidates[0].grounding_metadata)

Considerații de securitate:

  • API-ul permite, de asemenea, etichetarea documentelor pentru a interoga doar acele documente etichetate într-un mod specific.

  • Puteți utiliza aceste etichete pentru a izola documentele pe subiecte sau departamente.

  • Puteți utiliza, de asemenea, depozite File Search Store separate și izolate per client (tenant) pentru o izolare maximă.

  • Nu uitați să folosiți chei API cu privilegii minime și să logați toate activitățile.


Rezultate practice ale File Search:

  • Întrebări și răspunsuri în limbaj natural

  • Fundamentarea este verificabilă în documente private pe care le puteți izola prin etichete (pentru securitate)

  • Suportă PDF, JSON, TXT ȘI DOCX (Microsoft Word)

Toate acestea la un cost redus, cel al indexării inițiale a documentelor (din noiembrie 2025)

Explorați detaliile tehnice oficiale pe Blogul Dezvoltatorilor Google ➛

Citiți studiul nostru de caz aprofundat despre utilizarea GenAI pentru analiză financiară ➛




Partea 3: Sinergia - Integrarea ambelor sisteme prin agenți AI



De ce să le integrăm?

Un Data Hub curat de la HubSpot poate deveni singura dvs. sursă de adevăr. File Search de la Google poate deveni expertul dvs. instantaneu în documentele companiei. Dar un avantaj uriaș vine din a le face să comunice între ele în timp real.

După cum am detaliat, File Search de la Gemini interoghează un set static de documente. Datele HubSpot CRM sunt vii și dinamice. Construirea unei punți între ele necesită un agent AI personalizat. Acesta este un orchestrator inteligent care știe ce instrument să folosească pentru fiecare întrebare.

Aici intervine un integrator, cum ar fi OPTI. Vedeți studiile noastre de caz pentru construirea unor astfel de sisteme și revedeți această diagramă. Noi creăm conexiunile:

Diagramă - de la datele companiei la HubSpot la Google Gemini File Search la chatbot-uri și cotații pentru afaceri
Figura 7: Exemplu de flux de cunoștințe integrate ale companiei. Explorați o arhitectură similară cu produsul nostru Vânzări cu AI ➛



Exemplu concret

În loc să petreacă o oră căutând prin Exceluri, e-mailuri și CRM, imaginați-vă un director de vânzări care se pregătește pentru un apel important cu un client. Acesta deschide un chatbot intern, construit special pentru el.

Acesta întreabă: „Dă-mi un rezumat de o pagină despre Clientul XYZ, incluzând MRR-ul lor actual, stadiul ultimului lor tichet de suport și orice studii de caz relevante pe care le avem pentru industria lor.

Iată ce se întâmplă:

  1. Directorul de vânzări vrea să se pregătească pentru un apel. Deschide o fereastră de chat.

  2. Agentul AI Multi-Tool primește interogarea. Agentul AI personalizat analizează cererea și o împarte în trei sarcini distincte.

  3. Preluarea datelor în timp real. Agentul apelează un conector HubSpot personalizat pentru MRR și stadiul tichetului clientului.

  4. Preluarea documentelor statice: Pentru studiile de caz, agentul interoghează instrumentul File Search pentru studii de caz relevante pe care le-a urcat compania (primind inclusiv citări).

  5. Sinteză inteligentă. Agentul, folosind Gemini, sintetizează informațiile și compune un rezumat complet, bazat pe date, cu citări care trimit înapoi la sursă.

Exemplu de flux de integrare RAG managed pentru o companie
Figura 8: Exemplu de flux de integrare RAG managed pentru o companie

Cereți un demo



În concluzie, tehnologia se schimbă pentru companiile de dimensiuni medii:

  • Cu Data Hub de la HubSpot, construiți o fundație fiabilă: o singură sursă de adevăr în cloud-ul CRM.

  • Cu File Search de la Google, adăugați peste orice colecție statică de documente un motor de inteligență puternic.

Dacă doriți să le utilizați pe amândouă, conectarea acestor două lumi noi într-un mod securizat prin intermediul agenților AI va duce la o afacere cu adevărat inteligentă.

În calitate de Partener de Soluții HubSpot și Partener Google Cloud (certificat ISO 27001/9001), OPTI proiectează conexiuni și integrări software securizate. Inclusiv platforma noastră Vânzări cu AI ➛.

Haideți să discutăm despre implementarea acestui ghid în cazul dvs.

Cereți un demo


Întrebări rapide

Care este problema principală pe care o rezolvă integrarea HubSpot Data Hub cu Gemini AI?

Problema principală este cea a 'datelor silozate' (siloed data). Integrarea permite unui Agent AI personalizat să combine datele live și dinamice din CRM-ul dvs. (HubSpot) cu cunoștințele statice din documentele interne ale companiei (PDF-uri, DOCX-uri indexate de Gemini), oferind o viziune completă și unificată.

Trebuie să fiu programator pentru a folosi HubSpot Data Hub?

Nu. HubSpot Data Hub este conceput pentru utilizatorii de business (non-tehnici). Uneltele sale, precum Data Studio, oferă un mediu vizual, fără cod ('no-code'), pentru a curăța, îmbogăți și combina seturi de date.

Ce înseamnă 'RAG' (Retrieval-Augmented Generation)?

RAG este o tehnică AI prin care modelul lingvistic (precum Gemini) este forțat să își bazeze răspunsurile exclusiv pe un set de documente pe care i le furnizați. Gemini File Search este un sistem RAG gestionat, care garantează că răspunsurile despre compania dvs. sunt exacte și verificabile, cu citări către sursa originală.

Poate echipa mea de marketing să implementeze Gemini File Search?

În stadiul actual (public preview), implementarea Gemini File Search este un proces tehnic, orientat către programatori, deoarece necesită utilizarea API-ului, a cheilor de API și a unor scripturi (ex: Python) pentru a încărca fișierele și a interoga sistemul.

Care sunt costurile implicate pentru HubSpot Data Hub și Gemini File Search?

Conform articolului (Noiembrie 2025), HubSpot Data Hub pornește de la 700$/lună pentru ediția Professional și 2000$/lună pentru Enterprise. Pentru Gemini File Search, costul este de 0.15$ per 1 milion de tokenuri pentru indexarea inițială, stocarea și interogările ulterioare fiind gratuite în perioada de preview.

De ce să integrez cele două? Care este avantajul unui Agent AI?

Avantajul principal este sinergia. Un Agent AI personalizat acționează ca un 'orchestrator inteligent'. El știe când să interogheze HubSpot pentru date live (ex: 'Care este MRR-ul clientului?') și când să interogheze Gemini File Search pentru date statice (ex: 'Ce scrie în contractul cu acest client?'), combinând răspunsurile pentru a oferi un insight complet.

Puteți oferi un exemplu concret de utilizare a unui astfel de Agent AI?

Da. Un director de vânzări poate întreba un chatbot intern: 'Dă-mi un rezumat despre Clientul XYZ, statusul ultimului său tichet de suport și studii de caz relevante pentru industria sa'. Agentul va prelua datele live (status tichet) din HubSpot, va căuta documentele statice (studii de caz) în Gemini File Search și va sintetiza totul într-un singur răspuns coerent.

Ce rol are un integrator precum OPTI în acest proces?

Rolul OPTI este de a proiecta și construi 'Agentul AI Multi-Tool' personalizat. Noi creăm conexiunile securizate între HubSpot și API-ul Gemini, dezvoltăm logica agentului care știe ce unealtă să folosească și construim interfața (ex: chatbot-ul intern) prin care angajații dvs. pot interacționa cu acest nou sistem inteligent.

Care sunt tehnologiile și metodologiile implicate?

Tehnologii: HubSpot Data Hub, HubSpot Data Studio, HubSpot Workflows, Google Gemini API, Gemini File Search, Python, Google AI Studio, API
Metodologii: Unificare date (ETL/Reverse ETL), Curățarea datelor (AI-Powered), Sincronizare bidirecțională, Retrieval-Augmented Generation (RAG), Interogare în limbaj natural, Agent AI Multi-Tool

Marian Călborean

Articol scris de

Marian Călborean

Manager, arhitect software. PhD. logică

Vezi profil LinkedIn →
Interesat?

Ești interesat?

programează o întâlnire

Cere consultanță gratuită

Noutăți și ghiduri

Mai multe noutăți