왜 우리는 가상화를 금지하는가: 베어메탈 아키텍처 선언문

지난 10년간 클라우드 컴퓨팅의 발전 역사를 살펴보면,가상 머신그리고하이퍼바이저(가상 머신 모니터)이는 항상 클라우드 인프라의 흔들리지 않는 절대적인 초석이었습니다. AWS의 EC2든 Google Cloud의 Compute Engine이든 거의 모든 퍼블릭 클라우드 거대 기업은 가상화 기술을 사용합니다. 가상화를 사용하면 클라우드 서비스 제공업체는 거대한 물리적 서버를 수십 또는 수백 개의 작은 인스턴스로 분할하여 분리된 여러 테넌트가 동일한 실리콘 조각, 동일한 버스 및 동일한 물리적 전원 공급 장치 세트를 공유할 수 있습니다. 이러한 극단적인 리소스 삭감 및 "초과 구독" 메커니즘은 클라우드 서비스 제공업체에 천문학적인 상업적 이익을 가져왔고 번영하는 SaaS 생태계를 만들었습니다.

그러나 기본 하드웨어 아키텍처의 급격한 변화의 기로에 서 있을 때, 특히 Apple Silicon(M 시리즈 칩)이 혁신적인 ARM 아키텍처로 데스크톱 및 워크스테이션 수준 컴퓨팅 성능 표준을 완전히 전복했을 때, 우리는 이 전통적이고 비대해진 X86 클라우드 아키텍처를 Mac 컴퓨팅 노드에 적용하려고 시도했지만 절박한 엔지니어링 병목 현상을 발견했습니다.가상화는 Apple 칩의 핵심 컴퓨팅 영혼을 돌이킬 수 없게 죽이고 있습니다.

오늘 NOVAKVM 엔지니어링 팀은 이 아키텍처 선언문을 발표합니다. 매우 심오한 기본 원리부터 시작하여, 컴파일 파이프라인과 극한의 성능을 추구하는 고강도 로컬 LLM(대형 언어 모델) 추론 시나리오에서 가상화가 왜 버려야 하는 독인지에 대한 자세한 분석을 제공합니다. 그리고 풀 스택 재구성을 통해 세계 최초의 순수하고 무손실이며 100% 기본 Apple Silicon 베어 메탈(Bare Metal) 스케줄링 제어 플레인을 만든 방법을 설명합니다.

[ SECTION_01 ] // I/O_ANALYSIS 값비싼 I/O 독: 하이퍼바이저가 기본 컴퓨팅 성능을 죽이는 방법

가상화가 왜 성능 독이 될 수 있는지 이해하려면 먼저 Apple 칩의 킬러 기능을 이해해야 합니다.통합 메모리 아키텍처(UMA). 기존 X86 워크스테이션 아키텍처에서는 CPU의 시스템 메모리(RAM)와 독립 그래픽 카드(GPU)의 비디오 메모리(VRAM)가 물리적으로 분리되어 있습니다. CPU가 그래픽 텍스처나 거대한 AI 신경망 가중치와 같은 대량의 데이터를 GPU 작업으로 전달해야 하는 경우 데이터는 느리고 좁은 PCIe 버스를 통해 앞뒤로 복사되어야 합니다. 엔지니어들은 이러한 데이터 전송 시간 손실을 "PCIe 벽"이라고 부릅니다.

Apple M4 및 M4 Pro 칩이 이 벽을 완전히 허물었습니다. CPU 성능 코어, 에너지 효율 코어, 멀티 코어 GPU 및 신경 엔진이 모두 동일한 실리콘 칩에 통합되어 있습니다.최대 64GB 또는 128GB의 초고대역폭 공유 메모리 풀에 물리적으로 직접 연결. 이는 Xcode의 병렬 컴파일 작업을 로컬에서 실행하거나 MLX 프레임워크를 사용하여 대규모 70B 매개변수 모델을 로드할 때 데이터가 서로 다른 컴퓨팅 장치 간에 "제로 복사"됨을 의미합니다. 데이터는 그대로 유지되지만 다른 코어가 메모리 포인터를 획득하고 작업이 즉시 발생합니다.

그러나 하이퍼바이저를 도입하자 낮은 수준의 재난이 발생했습니다.

"가상화 계층은 CPU 물리적 명령과 기본 하드웨어 주변 장치 사이에 매우 두꺼운 소프트웨어 에이전트 계층을 강제로 삽입합니다. 모든 고속 메모리 주소 지정과 모든 동시 파일 시스템 읽기 및 쓰기는 이 에이전트 계층에 의해 차단, 변환 및 시뮬레이션되어야 합니다. 밀리초가 중요한 컴파일 세계에서 이는 느린 자살입니다."

내부 벤치마킹 랩에서는 2백만 줄이 넘는 Swift/Objective-C 코드가 혼합된 실제 대규모 엔터프라이즈 iOS 앱 프로젝트를 사용합니다. 테스트 결과는 충격적이었습니다.

100% 베어 메탈 M4 Pro(14코어/64GB):증분 컴파일 및 전체 인덱싱에 시간이 많이 소요됨4분 15초. 시스템 로드가 매우 원활하고 NVMe 대기열에 정체가 없습니다.
M4 Pro 가상 머신과 동일한 구성(14 vCPU/64GB 할당):증분 컴파일 시간이 급증했습니다.12분 40초. 이때 호스트의 팬은 최대 속도에 도달하고 커널 모니터에는 엄청난 속도가 표시됩니다.sys time기본 페이지 테이블의 2차 변환과 I/O 가상화 에이전트 차단에 사용됩니다.

BENCHMARK_EXECUTION.LOG

root@mg-lab-01:~$ xcodebuild -project Core_Enterprise.xcodeproj -benchmark
> Initiating Build Sequence...
> Allocating parallel compilation threads: 14

[VM Environment Detected - KVM/Hypervisor Hooked]
> Translation overhead: SEVERE
> I/O wait time spiking: > 4200ms
> Result: Build finished in 760.5s. (12m 40s)

root@mg-lab-02:~$ xcodebuild -project Core_Enterprise.xcodeproj -benchmark
> Initiating Build Sequence...

[Bare Metal Environment Detected - Direct Hardware Access]
> Native Metal framework hooked. Zero-copy memory mapped.
> Direct NVMe PCIe lanes confirmed.
> Result: Build finished in 255.0s. (4m 15s)

[ SECTION_02 ] // SECURITY_AUDIT "시끄러운 이웃"과 보안 위험: 공유 자원의 아킬레스건

극도로 높은 I/O 및 명령어 변환 손실 외에도 가상화 및 물리적 머신 공유 메커니즘은 클라우드 컴퓨팅 업계에 악명 높은 문제를 야기합니다."시끄러운 이웃 효과". 단일 호스트에서 여러 가상 머신을 실행한다는 것은 무엇을 의미합니까? 이는 동일한 M4 칩을 공유하는 다른 테넌트가 CPU를 미친 듯이 점유할 경우 가상 머신 성능이 필연적으로 예측할 수 없고 심각한 지터를 경험하게 됨을 의미합니다. 기본 CPU 레벨 2(L2) 및 시스템 레벨(SLC) 캐시는 인접 프로세스에 의해 무자비하게 플러시되고 제거됩니다(캐시 스래싱). 이렇게 극도로 불안정한 컴퓨팅 성능 출력은 궁극적인 안정성을 추구하는 기업 수준의 지속적 통합(CI/CD) 파이프라인에 치명적인 타격을 줍니다.

더욱 걱정스러운 것은하드웨어 수준의 보안 방어 경계. 보안 연구자들은 가상 머신 전반에 걸친 물리적 부채널 공격(예: 유명한 Spectre 및 Meltdown과 ARM 아키텍처를 표적으로 하는 그 변종)이 이론과 실제적으로 여전히 악용될 수 있는 창이 있음을 수없이 입증했습니다.

NOVAKVM에서는 이러한 숨겨진 위험을 근절하기 위해 가장 폭력적이고 효과적인 방법을 사용합니다.물리적 격리. 임대하는 것은 컴퓨팅 성능뿐만 아니라 알루미늄 합금 케이스와 마더보드를 갖춘 실제 독립형 Mac mini입니다. 임대가 종료되면 당사의 제어 평면은 Apple 실리콘에서 최고 수준의 보안을 실행합니다.Secure Enclave, 하드웨어 수준 데이터 암호화 키를 파기하고 다음을 따르십시오.DoD 5220.22-M 기준전체 NVMe 하드 드라이브에 대해 전체 물리적 덮어쓰기를 수행합니다.

[ SECTION_03 ] // SYSTEM_REBUILD 경계 재구성: 0에서 1까지 베어 메탈 제어 평면 구축

가상화의 다양한 단점을 이해한 후 팀은 매우 어려운 선택에 직면했습니다. 추세를 따르고 성숙한 가상 머신 솔루션을 사용하여 머신을 과도하게 판매하고 편안하게 높은 수익을 얻을 것인지; 아니면 이전에 한 번도 가본 적이 없고 공학적 깊은 물이 가득한 가시밭길을 선택해야 할까요? 우리는 과감하게 후자를 선택했습니다.

"인간 운영자가 클라우드 컴퓨팅의 병목 현상을 일으키게 할 수는 없습니다. NOVAKVM에서는 모든 작업이 코드 중심으로 이루어져야 합니다."

수백일 밤낮으로 리버스 엔지니어링과 아키텍처 설계를 거친 후, 기본 네트워크 및 시스템 엔지니어로 구성된 우리 팀은 Apple의MDM(모바일 장치 관리) 프로토콜 프레임워크, Golang을 기반으로 처음부터 높은 동시성 세트를 구축했습니다.맥 베어메탈 오케스트레이션 데몬(Orchestration Daemon).

NOVAKVM 콘솔을 클릭하면DEPLOY INSTANCE, 조용한 데이터 센터에서는 다음과 같은 마법이 자동으로 고속으로 발생합니다.

일정 및 배포:파견 센터는 리소스 풀에서 전원이 꺼진 상태의 물리적 시스템을 잠급니다.
하드웨어 재설정 및 네트워크 부팅:스마트 PDU는 장치에 즉시 전원을 공급하고 맞춤형 기본 네트워크 스위치는 장치의 이더넷 포트를 고도로 격리된 복구 VLAN으로 전환합니다.
기본 이미지 깜박임:배포 서버는 인트라넷 10G 채널을 통해 매우 순수한 기본 macOS 운영 체제 이미지를 새 시스템에 쏟아 붓는데, 이 작업에는 90초도 채 걸리지 않습니다.
권한 이전:MDM 프로토콜은 공용 네트워크에서 정적 IPv4 라우팅을 자동으로 구성하라는 명령을 내리고, 미리 제공한 SSH 공개 키를 시스템에 정적으로 기록합니다.authorized_keys핵심 신뢰 체인에서.

[ SECTION_04 ] // MLX_BENCHMARK 한계를 넘어서: Apple MLX의 통합 메모리 돌진

베어메탈 아키텍처가 제공하는 이점은 단순한 Xcode 컴파일 그 이상입니다. 오늘날 이 아키텍처는 가장 많이 활용되고 있습니다.국소화된 대형 모델(LLM) 및 엔드사이드 추론에 대한 연구.

"통합 메모리 아키텍처" 덕분에 하나의 구성으로64GB 이상의 메모리M4 Pro 물리적 시스템의 경우 시스템 메모리를 GPU에 의해 고속 비디오 메모리로 직접 사용할 수 있습니다! Apple의 공식 오픈소스와 연동MLX 프레임워크, 개발자는 번거로운 메모리 분할 및 카드 간 통신 없이 베어메탈 하드웨어에 직접 초대형 매개변수 확장 모델을 원활하게 로드할 수 있습니다.

MLX_INFERENCE_TEST.LOG

# NOVAKVM 64GB 베어메탈 노드에 중요하지 않은 모델 로드
root@mlx-engine:~$ python -m mlx_lm.generate \
    --model meta-llama/Meta-Llama-3-70B-Instruct \
    --prompt "Explain quantum entanglement."

> Allocating unified memory buffer...
[OK] 48.2 GB mapped to GPU address space directly.
> Bootstrapping Neural Engine...

> Generation completed.
> Profiling: Token generation speed: 18.5 tokens/sec
> VRAM Overflow: FALSE (100% Native UMA Support)

[ SECTION_05 ] // FUTURE_VECTOR 미래를 향한 제공: 소프트웨어 정의 하드웨어의 향후 10년

우리는 현대 컴퓨팅 인프라의 진화 경로가 시스템과 하드웨어 사이에 무겁고 복잡한 소프트웨어 추상화 계층을 지속적으로 쌓아서는 안 된다고 굳게 믿습니다. 오히려 미래의 클라우드 컴퓨팅은 매우 투명해야 합니다.Upward에서는 부드럽고 매끄러운 API와 고도로 자동화된 추상 경험을 제공합니다. 아래쪽으로 내려가면 바로 아래쪽 실리콘 칩으로 이동하여 컴퓨팅 성능이 자유롭게 흐를 수 있습니다.

NOVAKVM에서는 "IaC(Infrastructure as Code)" 개념을 물리적 수준으로 구현합니다. 우리의 장기 목표는 개발자에게 완전한 Terraform 공급자 도구 체인을 제공하는 것입니다. 그러면 AWS에서 EC2 인스턴스를 조정하는 것처럼 몇 줄의 선언적 코드를 사용하여 전 세계 여러 대륙에서 거대한 순수 물리적 Mac 컴퓨팅 매트릭스를 몇 분 안에 가져올 수 있습니다.

가상화의 배당 시대가 정점에 이르렀습니다. 개발자는 더 이상 컴퓨팅 전력 손실에 대한 세금을 지불해서는 안 됩니다. 오늘 NOVAKVM에서는 가상화 메커니즘과의 전쟁을 공식적으로 선포하고 컴퓨팅의 경계를 재정의합니다.

느리고 불안정하며 예측할 수 없는 빌드 시간으로 인해 엔지니어링 흐름이 중단되지 않도록 하십시오. 순수하고 잔인하며 나만의 베어메탈 시대에 오신 것을 환영합니다.

가상화를 금지하려는 이유:베어메탈 아키텍처 선언문

[ SECTION_01 ] // I/O_ANALYSIS 값비싼 I/O 독: 하이퍼바이저가 기본 컴퓨팅 성능을 죽이는 방법

[ SECTION_02 ] // SECURITY_AUDIT "시끄러운 이웃"과 보안 위험: 공유 자원의 아킬레스건

[ SECTION_03 ] // SYSTEM_REBUILD 경계 재구성: 0에서 1까지 베어 메탈 제어 평면 구축

[ SECTION_04 ] // MLX_BENCHMARK 한계를 넘어서: Apple MLX의 통합 메모리 돌진

[ SECTION_05 ] // FUTURE_VECTOR 미래를 향한 제공: 소프트웨어 정의 하드웨어의 향후 10년

가상화를 금지하려는 이유:
베어메탈 아키텍처 선언문