Paxata 2020.2 버전 추가 기능 공개

 

1. Fill-Up / Down / Average / Linear fit

 

2019.1 버전까지는 Fill-Down 기능만 있었으나 2020.2 버전부터 Up, Average, Linear fit 기능이 추가되었습니다.

 

Fill-Average

1. 기본적으로 빈 셀의 위/아래의 값의 평균으로 값을 채웁니다.

2. Grouped by를 설정하면 위와 같이 마지막 값이 빈 셀일 경우 다음 그룹의 값을 사용하여

    평균을 계산하지 않고 그룹 내의 바로 위의 값을 가져옵니다.

 

Fill-Linear fit

빈 셀이 연속해서 나올 경우 빈 셀 위, 아래의 값 사이가 등차가 되도록 채웁니다.

 

 

2. Window Function

 

Aggregate

1. 최소 한 개의 Grouped by 키를 설정해야 합니다.

기본적으로 선택된 함수로 Grouped by 된 값이 새로 생성된 컬럼 값에 동일하게 입력됩니다.

2. 이때 빈 셀이 있으면 빈 셀을 제외한 나머지 값들로 계산한 뒤 일괄 입력됩니다.

 Shift

값을 설정한 숫자만큼 상단으로 올립니다. 0 이하의 값은 설정할 수 없습니다.

 Rank

그룹 Sorting 키를 생성할 수 있습니다. 최소 한 개의 Grouped by 키를 설정해야 합니다.

 

 

3. Similarity(Fuzzy) Lookup

 

Lookup 키 사이의 유사도를 조사하여 매핑합니다.

이때 Similarity Score Threshold 값이 커질수록 Exact 매핑이 됩니다.

 

1. Similarity Score Threshold를 0.5로 설정합니다.

2. 그러면 위와 같이 약간의 차이가 있던 값이 매핑되고 Similarity Score 컬럼에 유사도가 입력됩니다.

Similarity Score Threshold를 1로 설정하면 Similarity Score가 1 미만이었던 값들은 모두 매핑되지 않습니다.

 

4. Range Join

 

1. Lookup 옵션 중 하나였던 Join이 상위 메뉴로 변경되었습니다.

2. Range 옵션을 사용하면 위와 같이 범위를 지정하여 Join이 가능합니다. (Between Join과 유사한 기능입니다)

① 범위로 Join할 컬럼을 지정합니다.

② From/To에 범위가 될 컬럼을 지정합니다. 이때 숫자 또는 날짜 형식만 범위로 지정이 가능합니다.

③ Include/Exclude 옵션으로 범위 값의 포함 여부를 설정합니다. 범위 이외에 나머지 Join 조건을 추가합니다.