Skip to main content
Register now for TDX! Join the must-attend event to experience what’s next and learn how to build it.

Data 360의 검색 색인 유형 알아보기

학습 목표

이 유닛을 완료하면 다음을 수행할 수 있습니다.

  • Data 360에서 지원되는 검색 색인을 설명합니다.
  • 사용 사례에 맞는 검색 색인을 식별합니다.

Data 360의 검색을 통해 AI 그라운딩

고객별 데이터를 기반으로 AI를 그라운딩하면 Salesforce Platform 전반의 애플리케이션, 분석, 자동화 도구에서 생성형 AI의 가치를 향상시킬 수 있습니다. AI 그라운딩은 비정형, 반정형, 또는 정형 데이터를 사용하여 구현할 수 있습니다. Agentforce, Tableau, Flow Builder와 같은 애플리케이션은 사용자 쿼리를 사용하여 AI 모델의 기반이 되는 관련 CRM 데이터를 검색함으로써 사용자 의도에 맞는 세밀한 결과를 제공합니다. Data 360의 검색 기능을 사용하여 정확하고 관련성 높은 AI 생성 콘텐츠, 심층적인 분석 인사이트, 팀과 고객을 위한 더욱 효율적인 자동화 워크플로를 구현하세요.

Data 360에서는 기술 자료의 비정형 데이터를 비롯한 모든 데이터에 대한 검색 색인을 구축할 수 있습니다. Data 360은 다음과 같은 검색 색인 유형을 지원합니다.

  • 벡터 검색
  • 하이브리드 검색

Data 360에서 검색 색인을 구축하려면 데이터를 Data 360으로 가져와야 합니다. Data 360은 비정형 데이터를 수집하여 표준 데이터 모델 개체(DMO) 또는 비정형 데이터 모델 개체(UDMO)로 매핑하고 데이터를 기반으로 의미 있는 콘텐츠 청크를 생성합니다. 그런 다음 Data 360은 벡터 임베딩을 생성하여 애플리케이션이 데이터의 시맨틱 및 어휘적 유사성을 이해하는 데 도움이 되는 검색 색인을 구축합니다.

Note

벡터 임베딩 및 기타 Data 360 용어에 대한 정의를 알아보려면 Data 360 용어집을 참조하세요.

검색 유형 선택하기

특정 사용 사례 및 데이터 집합에 가장 적합한 검색 유형을 결정하기 전에 먼저 이러한 검색 유형 간의 차이점과 가장 관련성 높은 응답을 생성하는 검색 쿼리 유형에 대해 살펴보겠습니다.

벡터 검색

시맨틱 검색이라고도 하는 벡터 검색은 주어진 검색 쿼리에 대해 의미적으로 유사한 데이터(또는 데이터 청크)를 검색하는 것입니다. 이 데이터에는 비디오, 오디오 및 통화 기록도 포함될 수 있습니다. 벡터 검색은 데이터를 청크 단위로 나누고 벡터 임베딩을 생성한 후 검색 쿼리와 의미적으로 유사한 벡터 임베딩을 검색하는 방식으로 수행됩니다.

Data 360에 수집된 다양한 데이터 소스의 데이터. Data 360은 데이터를 청크 단위로 나누고 벡터 임베딩을 생성하여 벡터 색인을 구축합니다. Tableau, Agentforce 등과 같은 C360 애플리케이션은 이 벡터 색인을 쿼리하여 관련 결과를 얻습니다.

벡터 검색은 사용자가 일반적인 정보를 찾는 긴 형식의 검색 쿼리에 적합합니다. 검색 쿼리는 의미적으로 가장 유사한, 벡터 검색 점수가 높은 데이터를 검색합니다.

예를 들어, Google Chrome 브라우저의 작동 방식에 대한 정보를 찾는 쿼리는 다음과 같습니다. 이 검색 쿼리는 해당 검색 쿼리와 의미적으로 가장 유사한, 벡터 검색 점수가 가장 높은 청크를 검색합니다.

쿼리:

select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm),
 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_
chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;

결과:

이 이미지는 벡터 검색 점수가 내림차순으로 정렬된 벡터 검색의 쿼리 결과를 보여줍니다. 검색 쿼리와 의미적으로 가장 유사한 데이터 청크가 결과 상단에 표시됩니다.

하이브리드 검색

하이브리드 검색에는 의미 인식 벡터 검색의 장점과 도메인 어휘를 처리할 수 있는 키워드 검색의 기능이 결합되어 있습니다. 하이브리드 검색은 두 가지 검색 유형에서 가져온 정보를 결합한 후 퓨전 랭커 함수를 사용해 결과의 순위를 매겨 가장 관련성 높은 정보를 보여줍니다..

기본 하이브리드 검색 퓨전 랭커 함수는 다양한 검색 기반 작업에 대한 내부 벤치마크를 기반으로 최적화되었습니다. 훈련 및 평가 데이터는 Einstein Search Answers와 같은 Einstein 검색 및 생성형 AI 애플리케이션에서 실제로 수집된 쿼리를 기반으로 합니다.

Data 360에 수집된 다양한 소스의 데이터. Data 360은 데이터를 청크 단위로 나누고 벡터 임베딩을 생성합니다. Data 360은 청크화된 데이터와 벡터화된 데이터를 기반으로 벡터 검색 색인 및 키워드 검색 색인을 구축합니다. 그런 다음 하이브리드 검색 퓨전 랭커 함수가 검색된 결과의 순위를 매기고 데이터를 쿼리하는 C360 앱에 가장 관련성이 높은 응답을 제공합니다.

하이브리드 검색은 특정 검색어도 포함된 긴 형식의 검색 쿼리에 적합한 옵션입니다. 검색 쿼리는 정확한 키워드 매칭과 관련된, 키워드 검색 점수가 높고 의미적으로 가장 유사한, 벡터 검색 점수가 높은 데이터를 검색합니다. 그 결과, 가장 관련성이 높은 검색 결과와 관련된, 하이브리드 검색 점수가 높은 데이터를 검색하게 됩니다.

벡터 검색에 사용한 동일한 쿼리 예시에서 키워드 검색은 관련성이 높은 콘텐츠에 더 높은 순위를 부여하여 LLM에 더 나은 기반을 제공합니다.

쿼리:

select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from
hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome
internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm
as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;

결과:

이 이미지는 하이브리드 검색 점수가 내림차순으로 정렬된 하이브리드 검색의 쿼리 결과를 보여줍니다. 검색 쿼리와 시맨틱 및 키워드 측면에서도 가장 잘 일치하는 데이터 청크가 결과 상단에 표시됩니다.

Note

사용한 Google Chrome 예시에서 동일한 쿼리에 대해 하이브리드 검색은 브라우저 작동 방식에 대한 정보와 Google Chrome 브라우저에 대한 구체적인 정보를 모두 포함하는 청크를 반환하므로 순수 벡터 검색보다 훨씬 강력한 성능을 보입니다.

요약

Data 360에서 검색 색인을 구축하여 조직의 비정형, 반정형, 또는 정형 데이터를 기반으로 AI를 그라운딩할 수 있습니다.

최종 사용자와 애플리케이션의 검색 쿼리에 가장 적합한 검색 유형을 선택하세요. 사용자의 쿼리가 주로 일반 정보에 관한 것이거나 쿼리가 긴 경우(5단어 초과)에는 벡터 검색으로 충분합니다. 벡터 검색은 사용자 쿼리에 컨텍스트 관련 콘텐츠가 포함되어 있을 때 관련성 높은 결과를 제공하며, 일반적으로 쿼리의 길이가 깁니다.

시맨틱 검색 매칭과 키워드 검색 매칭을 모두 결합하여 가장 정확하고 관련성 높은 결과를 얻으려면 하이브리드 검색 색인을 생성하세요.

리소스

Salesforce 도움말에서 Trailhead 피드백을 공유하세요.

Trailhead에 관한 여러분의 의견에 귀 기울이겠습니다. 이제 Salesforce 도움말 사이트에서 언제든지 새로운 피드백 양식을 작성할 수 있습니다.

자세히 알아보기 의견 공유하기