Solutions > Paxata

오늘날 데이터 분석 측면에서의 가장 큰 도전 과제는 내부와 외부에 있는 정형 데이터와 비정형 데이터를 어떻게 합치고 분리하고 빈 필드를 처리하고 정제하고 변환하는 가입니다.

이러한 문제들이 데이터를 준비하는 측면에서 빠르게 해결된다면 낭비되는 수많은 시간을 획기적으로 줄일 수 있고, 이는 곧 의사결정 속도에 변화를 가져오며 더 나아가 BI 측면에서 큰 기회로 작용될 것입니다.

Paxata는 데이터 크기에 상관없이 데이터를 다루는 기존 사용자들의 분석 생산성을 비약적으로 높여주며 이를 바탕으로 더욱 큰 가치를 만들어 낼 수 있습니다.

Paxata의 Data Preparation Solution은 Apache Hadoop과 Spark를 기반으로 엔터프라이즈 레벨의 강력한 플랫폼을 제공합니다. Cloud를 사용하는 고객들 또한 On-premise의 유연성과 보안성을 전부 같은 환경에서 사용할 수 있으며, Hadoop과 Hadoop을 사용하지 않는 모든 환경에서 유연성 있게 적은 노력으로 더욱 나은 가치를 창출해내며 기업의 경쟁력을 높일 수 있습니다.

제품문의

제품에 관한 문의사항은 담당자와 직접 상담해 보시기 바랍니다.

Paxata 특징

01. 대규모 데이터 처리 및 사용자 편의성 제공

샘플링 데이터로만 처리 가능한 다른 솔루션들과 달리, Paxata는 모든 데이터에 대해 데이터 프로파일링, 조인, 이상 감지 및 데이터 표준화를 수행할 수 있습니다. 또한 데이터를 직접 눈으로 확인하며 실시간으로 처리할 수 있고, Excel과 유사한 인터페이스를 갖추고 있어 복잡한 코딩없이 간단한 클릭만으로 데이터를 탐색, 정리, 표준화, 조합 및 조인할 수 있습니다.

02. 복잡한 데이터를 간단하게 변환

Paxata의 Intelligent Ingest는 사용자가 알 수 없는 파일 형식의 데이터를 빠르게 이해하고 통합할 수 있도록 도와줍니다. 내장된 알고리즘은 데이터를 지속적으로 프로파일링하고 데이터 표준화, 정제, 조합 및 조인에 대한 권장사항을 제공합니다.

Paxata의 Intelligent Automation은 클릭 한 번으로 원하는 시간에 복잡한 워크플로우가 실행될 수 있도록 도와줍니다.

03. 저비용으로 다양한 워크 로드에 대응 가능한 탄력적 스케일링

Paxata는 탄력적으로 스케일링이 가능하여 다양한 워크 로드에 동적으로 대응하고 임시 클러스터를 할당함으로써 비용을 절감할 수 있습니다. Paxata는 다중 테넌트(Multi-tenant) 클라우드나 하이브리드 환경에서 실행되며, Paxata에서 수행되는 모든 작업들에 데이터 볼륨 크기를 적절하게 조정합니다.

04. 기업을 위한 거버넌스 및 보안

Paxata는 사용자가 데이터에 실행하는 모든 작업들을 자동으로 저장하며, 저장된 작업과 관련 메타데이터는 이해하기 쉬운 End-to-End 추적성을 제공합니다. 기존 프로세스를 언제든지 재사용할 수 있고, 프로세스를 원하는 시간에 자동화할 수 있습니다. 또한 IT 담당자는 세분화된 보안을 통해 중요한 데이터에 대한 접근을 제한할 수 있습니다.

05. 효율적인 데이터 관리와 프로젝트 가속화를 위한 협업

Paxata는 내장된 카탈로그를 통해 데이터를 효율적으로 관리할 수 있습니다. Google과 유사한 검색, 태그 및 주석 기능을 사용하여 카탈로그를 쉽게 탐색하고 프로젝트에 적합한 데이터를 찾을 수 있습니다.

Google Sheets의 동시 프로젝트 보기 및 편집과 유사하므로, 데이터 소유자와 분석가가 동일한 데이터로 협업하고 신속하게 프로토타입을 작성하며 원하는 결과를 이끌어낼 수 있습니다.

Paxata 기능

데이터 수집

Excel, CSV, JSON, XML, Avro와 같은 로컬 파일뿐만 아니라 관계형 데이터베이스, Hadoop 또는 NoSQL 데이터베이스에 존재하는 반정형 데이터까지 다양한 데이터 소스로부터 데이터를 수집할 수 있습니다.

검사 및 탐색

데이터를 빠르게 이해하고 전처리하기 쉽도록 실시간으로 데이터를 탐색합니다. 각 컬럼별 필터그램 기능을 통해 데이터 검색 및 정렬, 이상치 데이터에 대한 탐색이 가능하며, 하이라이트 기능을 사용하여 전체 데이터에 대한 패턴과 공백을 직관적으로 확인할 수 있습니다.

정제 및 변환

NLP(Natural Language Processing) 알고리즘을 사용하여 유사한 값들을 자동으로 표준화하고, 컬럼 분리 및 연결하며, 중복 제거가 가능합니다.

정형화

한 번의 클릭으로 데이터를 피벗 또는 디피벗 할 수 있고, 컬럼을 분리할 수 있으며, 데이터 집계가 가능합니다.

공유 및 거버넌스

클릭 한 번으로 데이터 프로세스를 자동화할 수 있습니다. 데이터 라이브러리 페이지를 통해 팀들 간에 데이터 공유 및 재사용이 가능하고 협업할 수 있습니다. Paxata의 인증, 승인 그리고 버저닝 기능을 사용해 안전하고 확실한 환경에서 작업할 수 있습니다.

병합

Paxata의 IntellifusionTM 머신러닝은 데이터들 간 조인이 자동으로 가능하도록 도와줍니다. 스크립트, SQL 또는 VLOOKUPS과 피벗 테이블 등과 같은 복잡한 Excel 기능을 사용하지 않고도 여러 개 데이터들을 하나의 AnswerSet으로 조합할 수 있습니다.

Paxata와 BI 도구

가공된 Paxata의 AnswerSet을 BI 도구를 이용해 시각화 할 수 있습니다.