​NI RF 하드웨어를 사용하여 머신 러닝 기반 디지털 전치왜곡 프로토타이핑 및 벤치마킹하기

개요

전력 증폭기(PA)의 디지털 전치왜곡(DPD)은 계속해서 활발하게 연구가 진행 중인 영역이며 머신 러닝을 통해 현대 통신 시스템의 문제를 해결할 수 있다는 희망이 보입니다. 이 문서에서는 NI RF 플랫폼을 사용하여 실제 PA에서 수집한 웨이브폼 데이터를 기반으로 머신 러닝 기반 DPD(ML-DPD) 모델을 훈련하고, 해당 모델의 전치왜곡 성능을 PA에서 검증한 뒤, 다른 최신 알고리즘과의 성능을 벤치마킹하는 방법을 설명합니다. 실험을 통해 얻은 주요 시사점을 제공하고 실제 배포에서 ML 기반 DPD를 사용하는 데 있어 직면하는 문제점과 연구 과제를 요약합니다.

내용

​RF 및 무선 통신 분야에서의 AI/ML

​최근 몇 년간 이루어진 인공 지능(AI) 및 머신 러닝(ML) 분야에서 엄청난 발전으로 인해 많은 산업 분야에서 까다로운 문제를 해결하기 위한 방법이 새롭게 등장했습니다. 무선 통신 분야에서 AI/ML의 사용은 새로운 서비스 제공과 모바일 네트워크 개선을 위해 현재 활발하게 논의 중인 가장 유망한 기술 후보 중 하나입니다.1 무엇보다 AI/ML은 이동통신망사업자(MNO)가 네트워크 효율성을 높이고 운영 비용을 절감하는 등 주요 목표를 달성하는 데 도움이 될 수 있습니다. 이러한 개선은 시간, 주파수, 공간 영역에서 리소스를 보다 지능적으로 할당하거나 더 나은 간섭 보상 방식을 통해 스펙트럼을 더욱 효율적으로 사용할 수 있다는 의미일 수 있습니다. 또한 AI/ML을 사용하면 에너지 효율성을 개선하여 기지국의 주요 비용 요인 중 하나를 해결할 수 있습니다. 예를 들어, 필요에 따라 기지국을 켜고 끄는 더 스마트한 방법으로 전력 증폭기를 보다 효율적으로 사용할 수 있습니다.  

​AI/ML은 네트워크 레벨에서 이미 성공적으로 사용되고 있지만, RF 계층, 물리 계층(PHY) 또는 MAC 계층과 같은 하위 계층에서 AI/ML을 사용하는 것이 훨씬 더 까다롭습니다. 하위 계층의 빠듯한 타이밍 제약으로 인해 기존 방법 대비 상당한 이점을 제공하는 견고하고 신뢰할 수 있는 AI/ML 기반 알고리즘을 개발하고 배포하는 것이 훨씬 더 어렵습니다.2 따라서 이 분야는 AI/ML을 적합한 영역에 성공적으로 적용하기 위해 다양한 장단점을 파악하고, 실제 네트워크 배포 환경에서 이러한 AI/ML 알고리즘이 견고하고 신뢰할 수 있음을 입증하기 위한 연구 단계에 있습니다. 궁극적으로 AI/ML의 도입이 기존의 접근 방식에 비해 확실한 장점이 있음을 입증해야 합니다.  

​현재 무선 통신 시스템의 RF/PHY/MAC 계층에 대한 AI/ML 연구 활동에는 다음과 같은 인기 있는 분야가 포함됩니다.  

  • ​RF—전력 증폭기의 효율성을 향상시키고 에너지를 절약하기 위한 ML 기반 디지털 전치왜곡(DPD)
  • PHY—더 적은 수의 파일럿 기호를 사용하거나 파일럿 기호를 사용하지 않음으로써 스펙트럼 효율성을 향상시키고 낮은 신호 대 노이즈 비율에서도 전송 품질을 동일하게 유지하여 에너지 효율성을 높이기 위한 ML 기반 채널 추정 및 기호 감지
  • ​MAC—사용자 방향으로 안테나 배열의 에너지를 조향하는 것을 목표로, 빔 수집 및 추적을 개선하기 위한 ML 기반 빔 관리. 그러면 셀 내에서 더 많은 사용자에게 서비스를 제공하여 스펙트럼을 보다 효율적으로 활용할 수 있습니다. 또한, 수신기의 신호 대 노이즈 비율을 실제 서비스 품질 요구에 맞게 조정하여 에너지를 절약할 수 있습니다.

​다른 NI 기술 백서에서 NI SDR 디바이스를 사용하여 리얼타임 신경망 수신기를 프로토타이핑하고 벤치마킹하는 프레임워크에 대해 설명했습니다. 이 기술 백서에서는 NI RF 하드웨어를 사용하여 전력 증폭기의 디지털 전치왜곡을 위한 ML 알고리즘의 프로토타이핑 및 벤치마킹 방법에 대한 사례 연구를 소개하면서, DPD에 대해 연구한 몇 가지 일반적인 신경망에 대한 간략한 개요를 제공합니다. 또한 실제 전력 증폭기(PA)의 웨이브폼 데이터를 사용하여 ML-DPD 모델을 훈련하며, PA에 대해 이 모델의 전치왜곡 성능을 검증하고 검증된 성능을 다른 최신 알고리즘들과 비교하여 벤치마킹하기 위한 프로토타입 애플리케이션을 어떻게 구현했는지 설명합니다. 마지막으로, 실험을 통해 얻은 주요 시사점을 제공하고 실제 배포에서 ML 기반 DPD를 사용하는 데 있어 직면하는 문제점과 연구 과제를 요약합니다.

​디지털 전치왜곡의 개요

​전력 증폭기(PA)가 비선형 영역에서 작동할 때 가장 효율적이라는 점은 잘 알려진 사실입니다. 안타깝게도 이 영역에서는 PA의 비선형적인 특성 때문에 상호 변조에서 원치 않는 대역 외 방출이 발생합니다. 일반적으로 디지털 전치왜곡은 송신기 웨이브폼에 적용되어 왜곡을 보정합니다. 보상, 즉 전치왜곡은 디지털 기저대역에서 PA 비선형성의 역을 적용하여 DPD와 PA의 조합된 응답이 다시 선형이 되도록 합니다. 그림 1은 이러한 보상 방식을 보여줍니다. 따라서 DPD 덕분에 PA는 비선형 영역에서 선형성을 잃지 않으면서 더 높은 전력 효율로 작동할 수 있습니다.  

​더 빠른 데이터 속도에 대한 수요가 늘어남에 따라 더 많은 대역폭이 필요한데, 이러한 대역폭은 더 높은 반송파 주파수에서 사용할 수 있습니다. 하지만 일반적으로 주파수가 높아질수록 에너지를 조향하고 높은 경로 손실을 극복하기 위해 안테나 배열이 필요합니다. 특히 이러한 조건에서 작동하도록 설계된 PA의 경우 다음과 같은 이유로 DPD를 적용하는 것이 훨씬 더 까다롭습니다.

  • ​기본 모델이 동적 작동 조건에 따라 변경되는 PA의 비정적 동작  
  • ​볼테라 급수 기반 모델이 더 이상 적합하지 않은 PA 비선형성의 복잡성 증가  

​앞서 언급한 현대 통신 시스템의 문제를 해결하려면 DPD에 혁신적인 접근 방식을 사용해야 합니다. 머신 러닝은 업계와 학계에서 활발하게 연구되고 있는 한 가지 접근 방식으로, 다음 섹션에서 설명할 것입니다.

 

디지털 전치왜곡의 원리

그림 1. 디지털 전치왜곡의 원리

 

DPD로 인한 스펙트럼 누출 개선

그림 2. DPD로 인한 스펙트럼 누출 개선

​그림 2는 디지털 전치왜곡을 적용했을 때와 적용하지 않았을 때 Wi-Fi PA의 출력 신호를 비교하여 전치왜곡으로 인해 스펙트럼 누출이 개선되는 예를 보여줍니다. DPD의 주요 과제는 사용되는 PA의 비선형성을 추정하는 것인데, 이는 기본적인 PA 모델을 추정하는 것을 의미합니다. 일반적으로 무기억 비선형성의 경우, 측정된 AM/AM 및 AM/PM 왜곡에 기반한 정적 룩업 테이블 접근 방식이 사용되었습니다. 반면, 기억성 비선형성의 경우, 메모리 다항식 모델(MPM) 및 일반화된 메모리 다항식(GMP) 모델과 같은 볼테라 급수 기반 모델이 주로 사용됩니다.

​머신 러닝 기반 디지털 전치왜곡

​신경망은 비선형 기억 효과를 동반하는 비선형 동작을 보이는 전력 증폭기와 같이 비선형 시스템을 모델링하는 기능 덕분에 동작 모델링 및 디지털 전치왜곡 분야에서 연구되고 있습니다.

​수십 년 전, 한 연구팀은 3G 전력 증폭기의 동작을 모델링하기 위해 다층 퍼셉트론(MLP) 구조 기반의 실수값 시간 지연 신경망(RVTDNN) 모델을 제안했습니다5. 신호의 동상 성분(I) 및 직교 위상 성분(Q)에서 탭 지연선을 사용하여 PA의 단기 기억 효과를 모델링했습니다. 강력한 기억 효과와 높은 비선형성을 보이는 3G 셀룰러 통신 시스템에서 PA의 동작을 모델링하기 위해 완전 순환 신경망(FRNN)이 제안되었습니다6. 이 방법은 복소 신호를 입력으로 사용하며 가중치와 편향도 복소수입니다. 신경망을 사용한 전력 증폭기의 디지털 전치왜곡은 WCDMA 신호에 대해 광범위하게 조사되고 검증되어7, 복소 경사 계산을 피하는 실수값 중심 시간 지연 신경망(RVFTDNN)을 제안했습니다.  

​순환 신경망(RNN)에는 현재 출력이 현재 입력뿐만 아니라 과거 입력에도 의존하는 기억 효과를 모델링하는 고유한 기능이 있습니다. 그러나 RNN은 경사 소실 문제로 인해 장기적인 기억 효과를 유지하는 데 어려움이 있습니다. RNN에서 경사 소실 문제를 해결하기 위해 장단기 기억(LSTM) 신경망이 제안되었습니다.8

​LSTM 신경망은 과거의 정보와 새로운 정보가 신경망 기억 상태에 미치는 영향을 더 잘 제어하기 위해 여러 유형의 게이트를 사용합니다.9 장기 기억 효과를 갖는 GaN PA의 동작을 모델링하기 위해 한 팀이 FRNN의 한계를 극복하기 위해 LSTM 신경망의 사용을 연구했습니다10.7 참조 문헌에서는 디지털 전치왜곡11,12을 위한 RNN 기반 신경망의 다른 개선된 버전 또는 최적화된 버전인 양방향 LSTM(BiLSTM) 및 게이트 순환 유닛(GRU) 신경망 등에 대해 설명합니다. 최근에는 PA의 동작 모델링 및 전치왜곡을 위해 합성곱 신경망(CNN)을 살펴보았습니다.13  

​또한 활성 안테나 배열이 적용된 대규모 MIMO 시스템에서 디지털 전치왜곡 파라미터의 지속적인 업데이트를 방지하기 위해 신경망이 제안되었습니다. 이 경우, 활성 안테나 배열은 빔 의존 부하 변조의 영향을 받습니다.14 이 사례 연구에서는 DPD를 위해 LSTM 기반 신경망을 구현하기로 결정했습니다.  

​그림 3은 구현된 신경망의 모든 계층을 보여줍니다. 이 신경망은 무왜곡 복소 시간 영역 신호 x[n]의 샘플을 입력으로 받아 출력 시 전치왜곡 복소 시간 영역 신호 z[n]의 샘플을 제공합니다. 하나의 시간 간격에서 LSTM 계층에 대한 입력은 현재 및 과거 M 입력 신호 샘플의 동상 성분 및 직교 위상 성분 i, q이며, 여기서 M은 기억의 깊이입니다.  

모델 아키텍처

그림 3. 모델 아키텍처

 

​학습(훈련) 단계에서 훈련 데이터 세트를 사용하여 신경망에 목표 DPD 기능을 학습시켜야 합니다. DPD 모델의 일반적인 학습 아키텍처는 직접 학습 아키텍처(DLA), 간접 학습 아키텍처(ILA) 또는 반복 학습 제어(ILC) 기반 아키텍처가 될 수 있습니다. 이 사례 연구의 경우 PA를 선형화하는 최적의 PA 전치왜곡 입력 신호를 제공하기 때문에 훈련 데이터 소스로 ILC를 선택했습니다.  

​ILC 기반 DPD는 모든 DPD 방법의 성능을 평가하는 데 유용한 벤치마크입니다.  

​그림 4는 무왜곡 입력 신호 x[n]이 주어졌을 때 ILC가 전치왜곡기 출력 신호 z[n]을 반복적으로 계산하는 학습 아키텍처를 보여줍니다. 여기서 출력 신호는 PA에 대한 입력 신호이기도 합니다. 충분한 반복 후, 최종 계산된 전치왜곡기 출력 신호는 이상적인 전치왜곡기 출력 신호와 이상적인 PA 입력 신호(zideal [n])라고 가정할 수 있습니다.

그림 4. 학습 아키텍처: 반복 학습 제어

 

​기존의 일반화된 메모리 다항식 모델을 포함한 모든 DPD 모델이나, 우리 사례에서처럼 신경망 모델에서 무왜곡 입력 신호와 그에 대응하는 이상적인 전치왜곡기 출력 신호의 쌍을 하나 이상 사용하여 파라미터를 훈련하거나 맞출 수 있습니다. 훈련 과정에서 이상적인 전치왜곡기 출력 신호는 DPD 모델이 생성하도록 학습해야 하는 목표 출력 신호의 정답(ground truth) 역할을 합니다. 이 과정은 그림 5에 나와 있습니다.

DPD 모델 훈련

그림 5. DPD 모델 훈련

​ML-DPD 프로토타이핑 및 벤치마킹 어플리케이션

​NI에서는 머신 러닝 기반 DPD 구현의 전체 워크플로를 연구하는 프로토타입 어플리케이션을 개발했습니다.

​이 어플리케이션은 NI PXI 섀시의 PXI 컨트롤러에서 실행되어 NI PXI 벡터 신호 트랜시버(VST)를 사용하여 RF 신호를 생성 및 분석하고 NI PXI 소스 측정 유닛(SMU)을 사용하여 PA에 DC 전원을 공급하고 디지털 컨트롤 라인을 구동합니다. 사용된 테스트 설정의 블록다이어그램은 그림 6과 같습니다.  

하드웨어 연결을 보여주는 테스트 설정

그림 6. 하드웨어 연결을 보여주는 테스트 설정

​이 어플리케이션을 사용하여 다음 단계를 수행합니다.  

  1. ​훈련 및 테스트에 사용할 웨이브폼 데이터를 생성합니다.  
  2. 실제 PA를 사용하여 훈련 데이터 세트를 생성합니다.  
  3. 훈련 데이터 세트를 사용하여 신경망 모델을 훈련시킵니다.  
  4. 훈련된 신경망 모델을 배포하여 실제 PA에 대한 입력을 미리 왜곡합니다.  

​그림 7에서는 이러한 사용자 작업을 보여줍니다. 이어지는 섹션에서는 이러한 작업에 대해 자세히 설명합니다. 신경망 모델 훈련을 제외하고 어플리케이션은 NI LabVIEW로 작성됩니다. 이 어플리케이션은 NI 벡터 신호 트랜시버(VST)를 사용하여 PA에서 표준 RF 측정을 수행하기 위해 NI RFmx 소프트웨어를 사용합니다. 또한 NI RFmx Waveform Creator를 사용하여 웨이브폼 파일을 생성합니다. 신경망 모델 훈련은 TensorFlow 및 Keras 라이브러리를 사용하여 Python으로 구현됩니다. 더 빠르게 실행하기 위해 NVIDIA GPU가 탑재된 Linux 서버에서 훈련이 실행됩니다.

ML-DPD 프로토타입 어플리케이션의 사용자 작업

그림 7. ML-DPD 프로토타입 어플리케이션의 사용자 작업

​1단계: 웨이브폼 데이터 NI-RFmx 웨이브폼 생성  

​생성기를 사용하여 통신 표준을 준수하는 웨이브폼을 생성할 수 있습니다. NI 사례 연구에서는 NI-RFmx Waveform Creator for WLAN을 사용하여 채널 대역폭이 80MHz인 1ms 길이의 802.11ax 프레임 여러 개에 대해 웨이브폼 데이터를 생성했습니다. 페이로드 데이터의 경우 유사난수 데이터 비트 시퀀스를 여러 개 사용하고 변조 차수를 BPSK에서 1024-QAM으로 변경했습니다. 웨이브폼은 TDMS 파일 포맷으로 저장됩니다.  

​이러한 웨이브폼이 NI 데이터 세트에서 무왜곡 입력 신호를 형성합니다. 사용자가 지정한 입력에 따라 웨이브폼 데이터 세트는 a) 훈련 웨이브폼 데이터 세트와 b) 테스트 웨이브폼 데이터 세트로 분할됩니다. 예를 들어, 훈련 웨이브폼 데이터 세트에는 일반적으로 일부 BPSK 웨이브폼이 포함되어 있습니다.  

​2단계: 실제 PA를 사용하여 훈련 데이터 세트 생성  

​다음 단계는 훈련 데이터 세트를 생성하는 것입니다. NN 모델을 훈련시키려면 무왜곡 입력 신호와 그에 상응하는 이상적인 전치왜곡기 출력 신호가 필요합니다. 이때, 이상적인 전치왜곡기 출력 신호는 RF 중심 주파수 및 입력 평균 전력 수준과 같이 미리 정해진 PA 작동 조건 세트에서 실제 PA를 사용하여 계산됩니다.  

​웨이브폼 TDMS 파일에서 읽은 각각의 무왜곡 입력 신호와 PA 작동 조건에 대해 이상적인 전치왜곡기 출력 신호를 계산하는 방법은 다음과 같습니다. RF 설정은 원하는 PA 작동 조건에 따라 NI-RFSG에서 구성됩니다. NI-RFSG는 1단계에서 생성된 훈련 웨이브폼 데이터 세트에 포함된 TDMS 포맷의 웨이브폼 파일에서 RF 신호를 읽어, NI VST 내 벡터 신호 생성기를 사용하여 PA 입력단에 RF 신호를 생성합니다. PA의 출력 신호는 NI VST 내의 벡터 신호 분석기가 수집하고 NI-RFmx SpecAn의 IDPD(ILC DPD) 측정 기능을 사용하여 측정됩니다. 측정 결과로 전치왜곡 웨이브폼이 얻어지며, 이를 이상적인 전치왜곡기 출력 신호로 간주하고 기록합니다.  

​신호 및 RF 설정의 관련 메타데이터와 함께 웨이브폼 I/Q 데이터는 TDMS 포맷의 훈련 데이터 세트 파일에 기록됩니다.  

​훈련 데이터 세트 파일에 포함된 정보는 다음과 같습니다.  

  • ​I/Q 웨이브폼 데이터  
    • ​무왜곡 입력 신호—왜곡되지 않은 기저대역 신호로, 사례의 1단계에서 생성된 802.11ax 웨이브폼. 멀티톤 신호와 같은 다른 웨이브폼이나 모든 무선 통신 표준을 준수하는 웨이브폼을 사용할 수 있습니다.
  • ​이상적인 전치왜곡기 출력 신호—반복 학습 제어(ILC)를 사용하여 계산된 웨이브폼. 이 웨이브폼에는 NI-RFmx SpecAn에서 ILC 기반 DPD(IDPD) 측정을 사용했습니다.  
  • ​메타데이터(예제 값이 포함된 중요한 콘텐츠)
    • ​ 웨이브폼 구성의 예  
      • ​표준: 802.11ax  
      • ​대역폭: 80MHz  
      • ​변조 차수: BPSK  
      • ​웨이브폼 길이: 1 ms  
      • ​웨이브폼 PAPR: 10.8dB  
  • ​RF 설정의 예  
    • ​RF 중심 주파수: 5.5GHz  
    • ​PA 입력 평균 전력 수준: -10dBm  

​앞서 언급한 것처럼 연구원은 이 데이터 세트를 사용하여 전치왜곡기를 위한 어떤 모델이든 훈련시킬 수 있습니다. 훈련 조건이 변경되지 않는 한, 훈련 데이터 세트를 수집하는 과정을 반복할 필요가 없습니다.

​3단계: 모델 훈련

​훈련 데이터 세트가 준비되면, 다음 단계는 모델을 훈련하는 것입니다. 사용되는 프로세스는 그림 8에 나와 있습니다. 이 훈련 어플리케이션은 TensorFlow 및 Keras 라이브러리를 사용하여 Python으로 작성되고 더 빠르게 훈련하기 위해 NVIDIA A100 GPU가 설치된 Linux 서버에서 실행됩니다. 훈련 웨이브폼 데이터 세트는 먼저 훈련, 검증 및 테스트 데이터 세트로 나뉩니다. 훈련 과정에서 모델에 훈련 및 검증 데이터 세트의 무왜곡 입력 신호가 공급되면 모델이 각각의 전치왜곡기 출력 신호를 예측합니다.  

​예측된 전치왜곡기 출력 신호는 관련된 이상적인 전치왜곡기 출력 신호와 비교되고 각각의 훈련 및 검증 손실이 계산됩니다. 훈련 손실은 모델 계수를 업데이트하는 데 사용됩니다. 검증 손실을 모니터링하여 모델이 잘 일반화되는지 평가하고 과대적합이 발생했는지 감지합니다. NI에서 사용하는 손실 메트릭은 예측된 모델 출력과 이상적인 바람직한 모델 출력(이상적인 전치왜곡기 출력) 간의 평균 제곱 오차(MSE)입니다.

모델 훈련

그림 8. 모델 훈련

​훈련 및 검증 실험에서, 그림 9와 같이 MSE 손실 값이 10-4 이하로 도달하고 훈련 및 검증 손실 곡선이 모두 매끄럽게 비슷한 낮은 값으로 수렴할 때 훈련이 성공적임을 확인할 수 있었습니다. 훈련 과정의 최종 출력은 훈련된 모델의 계수를 포함하는 H5 파일입니다.  

바람직한 훈련 및 검증 손실 곡선

그림 9. 바람직한 훈련 및 검증 손실 곡선

​4 단계: 실제 PA에 입력할 신호를 미리 왜곡하기 위해 모델 배포

​훈련된 ML-DPD 모델은 훈련된 적이 없는 웨이브폼 데이터에 대해서도 잘 작동하는지 검증하기 위한 테스트를 거쳐야 합니다. 이를 위해 신호를 PA로 생성하기 전에 훈련된 모델을 사용하여 테스트 웨이브폼 데이터 세트의 웨이브폼 데이터에 DPD를 적용합니다. 모델은 모델 계수 파일과 웨이브폼 데이터를 입력으로 전달하여 LabVIEW의 Python 라이브러리 호출을 사용하여 적용됩니다. 이 모델의 성능은 ILC DPD와 비교됩니다. ILC DPD 및 ML-DPD와 함께 테스트 어플리케이션은 메모리 다항식 DPD와 같은 기존의 DPD 방법을 적용하여 ML-DPD의 성능을 비교해 볼 수도 있습니다. (신호 유형에 따라) NI RFmx SpecAn 및 RFmx NR 또는 RFmx WLAN을 사용하여 RMS EVM 및 ACLR과 같은 표준 메트릭으로 성능을 비교할 수 있습니다.

바람직한 훈련 및 검증 손실 곡선

그림 10. 바람직한 훈련 및 검증 손실 곡선

​샘플 결과

​이 프로토타입 어플리케이션을 사용하여 TriQuint Wi-Fi PA에 대한 ML-DPD를 설계하고 테스트했습니다(평가 보드: TQP887051).

PXI 시스템을 사용한 ML-DPD 프로토타입 어플리케이션의 테스트 설정     TriQuint Wi-Fi PA를 사용한 ML-DPD 프로토타입 어플리케이션의 테스트 설정

그림 11. PXI 시스템(왼쪽)과 TriQuint Wi-Fi PA(오른쪽)를 사용한 ML-DPD 프로토타입 어플리케이션의 테스트 설정

​테스트를 위해서 중심 주파수로 5.5GHz, PA 입력 평균 전력 수준으로 -8.5dBm을 선택했습니다. 그림 11은 약 10.5dB의 PAPR을 가진 802.11ax, 80MHz, 1024-QAM 웨이브폼을 사용하여 NI-RFmx SpecAn으로 측정한 이 작동 지점에서 PA의 AM-AM 특성을 보여줍니다. PA는 약 25.7dB의 선형 게인을 보여줍니다. 피크 입력 전력 수준이 약 2dBm일 때 PA의 출력은 약 3dB의 게인 압축을 보여줍니다.

5.5GHz에서 PA의 AM-AM 특성, -8.5dBm의 입력 평균 전력 수준

그림 12. 5.5GHz에서 PA의 AM-AM 특성, -8.5dBm의 입력 평균 전력 수준

​NI에서는 BPSK 변조 방식과 13가지 다른 802.11ax 프레임이 포함된 훈련 데이터 세트를 사용하여 이 작동 지점에서 모델을 훈련했습니다. 모델 파라미터 기억 깊이가 4개 샘플로 설정되었으므로, 모델 크기는 약 24,000개 파라미터입니다. 검증 데이터 세트에는 BPSK 변조 방식을 적용한 802.11ax 프레임이 3개 포함되어 있습니다. 각 802.11ax 프레임의 길이는 1ms입니다. 그림 12는 훈련 중에 관찰된 손실 곡선을 보여줍니다. 관찰된 훈련 및 검증 손실이 약 2×10-4이면 허용 가능한 수준입니다. 기억 깊이에 대해 다른 값을 시도했고 값 4가 적절한 것으로 확인되었습니다.

훈련된 모델의 손실 곡선

그림 13. 훈련된 모델의 손실 곡선

​여러 웨이브폼 데이터를 사용하고, 입력 평균 전력 수준을 -15dBm에서 -8.5dBm까지 0.25dB 간격으로 변화시키며 모델을 테스트했습니다. 그림 13에서 보여주는 테스트 결과의 예에서는 테스트 데이터 세트의 1024-QAM 웨이브폼 데이터 파일을 사용했습니다. 이는 위의 AM-AM 특성 측정에 사용된 웨이브폼과 동일합니다. NI에서는 3가지 전치왜곡 모드에 NI-RFmx WLAN을 사용하여 RMS EVM을 측정했습니다.  

  1. 전치왜곡 없음  
  2. ILC DPD  
  3. ML-DPD  

​ML-DPD가 ILC DPD 데이터를 '정답'으로 사용하여 훈련되었기 때문에 ML-DPD의 성능을 ILC DPD의 성능과 비교했습니다. 그래프에서 볼 수 있듯이, ILC DPD와 ML-DPD는 전치왜곡을 적용하지 않은 상태에서 측정한 EVM에 비해 EVM이 크게 향상되었습니다. 훈련 중에 사용된 -8.5dB의 입력 전력 수준에서 훈련된 ML-DPD는 최적의 ILC DPD와 동일한 EVM 성능을 제공합니다.  

​대부분의 다른 입력 전력 수준에서 ML-DPD의 EVM 성능은 ILC DPD로 달성한 값에 가깝습니다(1dB 이내). -10.5dBm ~ -9.5dBm의 입력 전력 범위에서만 ML-DPD와 최적의 ILC DPD 간에 EVM 편차가 최대 2dB까지 조금 더 크게 나타납니다. 이러한 편차는 해당 전력 수준에서 추가로 얻은 훈련 데이터를 훈련 과정에 통합하여 더 줄일 수 있습니다.

그림 14. 전치왜곡을 적용한/적용하지 않은 WLAN RMS EVM

​요약 및 결론

​이 문서에서는 NI 소프트웨어와 하드웨어를 활용하여 전력 증폭기의 디지털 전치왜곡에 머신 러닝 접근 방식을 적용하고, 이를 프로토타이핑, 검증 및 벤치마크하는 방법을 보여주었습니다. NI에서는 동일한 프로토타이핑 시스템을 사용하여 훈련 데이터를 생성하고 다른 최신 DPD 알고리즘과 비교하여 추론 성능을 검증했습니다. LSTM 기반 신경망을 Wi-Fi PA의 DPD에 적용하기 위한 예제 결과도 보여주었습니다. 이 구체적인 예시에 대한 결과는 ML DPD의 성능이 ML 모델 훈련에서 참조로 사용한 ILC DPD가 제공하는 하위 경계에 가깝다는 것을 보여줍니다.  

​이 예시의 결과는 좋아 보이지만, NI의 연구에서는 예시 ML DPD 모델이 예상대로 작동하지 않는 상황도 발견했다는 점에 주목할 필요가 있습니다. 이 연구의 주요 시사점 중 하나는 효율성과 복잡성 사이의 균형을 더 잘 이해하기 위해 새로운 ML-DPD 모델을 다른 DPD 접근 방식과 항상 비교하고 벤치마킹하는 것이 중요하다는 점입니다. ML DPD가 효과적인 경우와 기존 DPD 알고리즘이 더 적합한 현실적인 시스템을 구분하여 각각의 장점을 입증하는 것이 중요합니다.  

​NI에서 더 많은 연구와 혁신이 필요하다고 느끼는 연구 분야는 다음과 같습니다.  

  • ​더 크고 일반화된 ML DPD 모델과, 작지만 운영 중에 재학습 및 적응이 가능한 모델 간의 장단점 및 그에 따른 학습 전략  
  • ​FPGA, GPU 또는 CPU 기반 대상 플랫폼을 위한 성능에 최적화되어 있으며 복잡도가 낮은 리얼타임 ML DPD 모델  
  • ​디지털 처리 플랫폼에서 ML DPD 알고리즘의 저전력 소모, 즉 DPD가 PA의 전력 절감 효과를 저해하지 않도록 하는 방안  
  • ​데이터 기반 ML DPD 모델의 신뢰성과 견고성을 효율적으로 입증하기 위한 지능형 검증 및 테스트 방법론  

​이러한 연구 과제를 살펴보려면 앞서 설명한 최첨단 하드웨어 및 소프트웨어가 탑재된 NI RF 하드웨어가 에너지 효율성이 더욱 뛰어난 RF 시스템을 설계할 때 고려해야 할 ML DPD의 구체적인 장단점을 이해하는 데 도움이 될 것입니다. 이러한 장단점에 대한 이해는 궁극적으로 모바일 통신망과 같은 중요한 시스템에서 고급 AI 기술 활용에 대한 신뢰를 높이는 데 기여할 것입니다.

​참고 문헌

​1 Sundarum, Meesha. “3GPP Technology Trends.” 5G Americas, 2024. https://www.5gamericas.org/3gp-technology-trends.  

​2 Polese, M., Dohler, M., Dressler, F., Erol-Kantarci, M., Jana, R., Knopp, R., Melodia, T., “Empowering the 6G Cellular Architecture with Open RAN.” IEEE Journal on Selected Areas in Communications, November 2023.  

​3 Summerfield, Steve. “How to Make a Digital Predistortion Solution Practical and Relevant.” Microwaves & RF, 2022. https://www.mwrf.com/technologies/embedded/systems/article/21215159/analog-devices-how-to-make-adigital-predistortion-solution-practical-and-relevant.

​4 Zhu, Anding, January 10, 2023. “Digital Predistortion of Wireless Transmitters Using Machine Learning.” IEEE MTT-S Webinar.

​5 Liu, T., Boumaiza, S., and Ghannouchi, F. M., March 2004. “Dynamic Behavioral Modeling of 3G Power Amplifiers Using Real-Valued Time-Delay Neural Networks.” IEEE Transactions on Microwave Theory and Techniques, 52 (3): 1025–1033.  

​6 Luongvinh, Danh and Kwon, Youngwoo, 2005. “Behavioral Modeling of Power Amplifiers Using Fully Recurrent Neural Networks.” IEEE MTT-S International Microwave Symposium Digest: 1979–1982.  

​7 Rawat, M., Rawat, K., and Ghannouchi, F. M., January 2010. “Adaptive Digital Predistortion of Wireless Power Amplifiers/Transmitters Using Dynamic Real-Valued Focused Time-Delay Line Neural Networks.” IEEE Transactions on Microwave Theory and Techniques 58 (1): 95-104.

​8 Hochreiter, S and Schmidhuber, J., November 1997. “Long short-term memory.” Neural Computation 9 (8): 1735–1780.  

​9 Olah, Christopher, “Understanding LSTM Networks.” Understanding LSTM Networks -- colah’s blog, August 27, 2015. https://colah.github.io/posts/2015-08-Understanding-LSTMs/.  

​10 Chen, P., Alsahali, S., Alt, A., Lees, J., and Tasker, P. J., 2018. “Behavioral Modeling of GaN Power Amplifiers Using Long Short-Term Memory Networks.” 2018 International Workshop on Integrated Nonlinear Microwave and MillimetreWave Circuits (INMMIC), Brive La Gaillarde, France, 2018, pp. 1–3.  

​11 Li, G., Zhang, Y., Li, H., Qiao, W., and Liu, F., 2020. “Instant Gated Recurrent Neural Network Behavioral Model for Digital Predistortion of RF Power Amplifiers.” IEEE Access, vol. 8: 67474–67483.  

​12 Kobal, T., Li, Y., Wang, X., and Zhu, A, June 2022. “Digital Predistortion of RF Power Amplifiers with Phase-Gated Recurrent Neural Networks,” IEEE Transactions on Microwave Theory and Techniques 70 (6): 3291–3299.

​13 Hu, X, et al., August 2022. “Convolutional Neural Network for Behavioral Modeling and Predistortion of Wideband Power Amplifiers.” IEEE Transactions on Neural Networks and Learning Systems 33 (8): 3923–3937.  

​14 Brihuega, A., Anttila, L, and Valkama, M. August 2020. “Neural-Network-Based Digital Predistortion for Active Antenna Arrays Under Load Modulation.” IEEE Microwave and Wireless Components Letters 30 (8): 843–846​