본문

뉴스 기사

[기사 제목]

인텔 컴퓨텍스 프리뷰: 실세계 성능에서 게이밍 최고 2배, AI 부스트 8배 향상된 신제품 공개

조회수 651 | 루리웹 | 입력 2019.05.27 (09:09:59)
[기사 본문]

5월 28일에 진행되는 인텔의 컴퓨텍스(Computex) 개막 기조연설에 앞서 인텔은 오늘 올해 출시 예정인 새로운 10나노미터(nm) 모바일 프로세서(코드명 “아이스 레이크”)와 9세대 인텔® 코어TM i9-9900KS 프로세서 스페셜 에디션을 일부 선 공개하는 등 실제 워크로드 성능에서 뚜력한 성능향상을 제공하는 제품들을 미리 선보였다. 인텔은 새로운 데이터 중심 컴퓨팅 시대에서 성능 리더십이 기존의 코어 개수나 주파수 중심에서 벗어나 어떻게 정의되어야 하는가에 대해 논의했다. 소프트웨어 역량에 힘입어 인텔 아키텍처는 현재 및 미래의 컴퓨팅 경험의 기준이 되는 실제 워크로드 성능 리더십에 최적화되어 있다.


인텔은 재정의된 제품 혁신 모델로 이러한 성능 리더십을 추진해, 프로세스 및 패키징, 아키텍처, 메모리, 인터커넥트, 보안 및 소프트웨어 등 여섯 가지 요소 중심의 기술 혁신을 묶어 워크로드에 최적화된 제품을 제공하고 있다.


인텔 아키텍처, 소프트웨어 및 그래픽의 수석 아키텍처 겸 수석 부사장인 라자 코두리(Raja Koduri)는 “새로운 하드웨어 아키텍처의 성능 잠재력이 한 자릿수라면, 소프트웨어로 실현 가능한 성능은 두 자릿수이다. 인텔은 워크로드에 최적화하고 인텔 프로세서의 성능을 더욱 개선하도록15,000명의 소프트웨어 엔지니어들을 투입하고 있다”고 말했다.


새로운 데이터 중심 시대를 위해 실제 워크로드에 성능 향상을 제공하는 구체적인 사례들은 다음과 같다.


모바일 그래픽 부스트 제공하는 아이스 레이크: 이달 초 인텔의 투자자 행사(Investor Meeting)에서 공개된 바와 같이, 인텔은 모바일 PC 제품으로 코드명 “아이스 레이크(Ice Lake)”인 10나노미터 프로세서의 초도물량을 출하하기 시작할 예정이다. 아이스 레이크에는 인텔의 새로운 11세대 그래픽 엔진이 적용되어 업계 최초로 내장 GPU에 VRS(Variable Rate Shading) 기능이 포함되면서, 장면 내 다양한 영역에 가변 처리 능력이 적용되어 렌더링 성능이 향상된다. 또한, CS:GO*, 레인보우 식스 시즈(Rainbow 6 Siege)* 및 토탈워: 삼국지(Total War: Three Kingdoms)* 등 일부 인기 게임에서 11세대 그래픽은 인텔 9세대 그래픽 대비 2배1 가량 높은 성능을 구현해 이동시에도 화려한 비주얼 경험을 제공할 예정이다. 


지능적 성능을 제공할 이기종 컴퓨팅 아키텍처: 인텔은 아키텍처 디자인 및 I/O 혁신을 통해 현재 출시된 제품에서도 클라이언트 및 데이터센터를 위한 이기종 컴퓨팅의 장점을 실현하고 있다. 아이스  레이크는 고도로 통합된 새로운 노트북용 플랫폼으로, 새로운 “서니코브(Sunny Cove)” 코어 아키텍처와 새로운 11세대 그래픽 아키텍처에 썬더볼트™ 3 및 인텔® 와이파이 6 (Gig+)를 사상 최초로 통합해, 동급 최강의 커넥티비티를 제공한다. 아이스 레이크는 또한 PC에서 인공지능(AI)을 구현할 수 있도록 설계된 인텔의 첫 프로세서로, CPU의 인텔® 딥 러닝 부스트(인텔 DL 부스트)와 GPU의 AI 명령 및 저전력 가속기를 적용해 PC의 새로운 지능형 성능 시대를 열어갈 전망이다. 흐릿한 이미지를 선명하게 만들거나 동영상에 스타일을 적용하는 등 일상에서 자주 사용하는 워크로드를 가속화해주는 아이스 레이크를 선보인 것 외에도, 인텔은 인텔 DL 부스트가 기존에 출시된 동급 제품 대비 AIXPRT 기준 최대 8.8배2 높은 AI 추론 스르풋을 제공할 수 있음을 시연하기도 했다. 


데이터 중심 플랫폼을 겨냥한 2세대 인텔® 제온® 스케일러블 프로세서(Intel Xeon Scalable processor)는 인텔 DL 부스트 AI 가속기가 빌트인 탑재된 유일한 프로세서로, 벡터 신경망 명령과 딥 러닝 소프트웨어 최적화가 결합되어 있다. 인텔 DL 부스트가 탑재된 2세대 인텔 제온 스케일러블 프로세서는 이전 세대 인텔 제온 프로세서와 비교 시 이미지 인식, 사물 추적 및 이미지 세분화 등 AI 추론 워크로드를 최대 14배4 가속화시킨다. 


현재 시장 내에서 일반적으로 사용되는 GPU 제품과 비교 시, 2세대 인텔 제온 스케일러블 프로세서는 현재 클라우드에서 가장 대중적인 AI 워크로드 중 하나로 데이터센터 추론5의 60% 이상을 차지하는 추천 시스템에서 2.4배 우수한 성능3을 제공한다. 


새로운 스페셜 에디션 데스크톱 게이밍 프로세서: 인텔은 9세대 인텔 코어 i9-9900KS 스페셜 에디션 프로세서를 미리 공개했다. 터보 주파수로전체 8개 코어가 5.0 GHz로 작동하는 최초의 프로세서로, 세계 최고의 게이밍 데스크톱 프로세서가 한층 더 우수한 성능을 갖추게 됐다. 


인텔은 또한 하드웨어 및 소프트웨어 혁신을 통해 인텔 프로세서에서 구동되는 인기 게임들이 궁극의 실세계 성능을 구현할 수 있도록 인텔이 어떤 최적화 과정을 진행하고 있는지를 선보였다. 한 해 동안, 인텔은 수십만 명이 넘는 게임 개발자들과 협력해 수백 종에 달하는 게임을 최적화했다. 


인텔 컴퓨텍스 개막 기조 연설에서 선보일 선도적인 성능 사례: 5월 28일 열리는 컴퓨텍스 2019 산업(COMPUTEX 2019 Industry) 개막 기조연설에서 그레고리 브라이언트(Gregory Bryant) 인텔 수석 부사장 겸 클라이언트 컴퓨팅 그룹 총괄 매니저가 인텔의 성능 혁신과 새로운 경험에 대해 구체적으로 짚어나갈 예정이다. 기조 연설의 생중계 등 보다 구체적인 사항은 인텔 뉴스룸(Newsroom)에서 확인할 수 있다.

 

 

인텔, 인텔 로고, 인텔 코어 및 인텔 제온은 미국 및 다른 국가에서 인텔의 상표로 등록돼 있다. 


*기타 이름 및 상표는 해당 소유권자의 재산이다. 


성능 테스트에서 사용되는 소프트웨어 및 워크로드는 인텔 마이크로프로세서 상에서의 성능을 위해 최적화된 것일 수 있다. SYSmark 및 MobileMark 등 성능 테스트는 특정 컴퓨터 시스템, 부품, 소프트웨어, 작동 및 기능을 이용해 측정된다. 이러한 요소에 대해 변경 사항이 발생하는 경우 결과는 상이하게 나타날 수 있다. 구매 고려 대상에 대해 다른 제품과의 조합 시 성능 등 보다 세밀한 평가를 진행하려는 경우, 다른 정보 및 성능 테스트를 참고해야 한다. 자세한 사항은 www.intel.com/benchmarks에서 확인할 수 있다. 


성능 결과는 구성 공개에 명시된 날짜에 시행된 테스트를 토대로 하며 공개적으로 제공된 보안 업데이트가 적용되지 않은 상태일 수 있다. 자세한 사항은 구성 정보를 참고하면 된다. 제품이나 부품에 대한 완벽한 보안은 불가능하다. 


최적화 공지: 인텔 마이크로프로세서에 고유화되지 않은 최적화를 위해 인텔의 컴파일러로 비인텔 마이크로프로세서를 최적화하는 경우, 최적화 수준은 동일하거나 동일하지 않을 수 있다. 이러한 최적화로는 SSE2, SSE3 및 SSSE3 명령 조합 및 기타 최적화 등이 있다. 인텔은 인텔이 제조하지 않은 마이크로프로세서 상에서 최적화의 가능 여부, 기능 여부 혹은 효과 여부를 보장하지 않는다. 해당 제품에서 마이크로프로세서에 의존적인 최적화는 인텔 마이크로프로세서를 사용하는 경우를 위한 것이다. 인텔 마이크로아키텍처에 특화되어 있지 않은 특정 최적화는 인텔 마이크로프로세서를 위한 것이다. 본 공지에 해당하는 구체적인 명령 조합과 관련해 자세한 사항은 해당되는 제품의 사용자 및 참고자료 가이드(User and Reference Guides)를 참고할 것을 권장한다. 


인텔 기술의 특성 및 장점은 시스템 구성에 의해 결정되며 하드웨어, 소프트웨어 혹은 서비스 활성화를 필요로 할 수도 있다. 성능은 시스템 구성에 따라 달라진다. 시스템 제조업체 혹은 판매업체를 통해 확인하거나 인텔 웹사이트에서 확인할 수 있다.

 

1 아이스 레이크 게이밍 성능: 토탈워: 삼국지(Total War: Three Kingdoms) 2.08배, 레인보우 식스 시즈(Rainbow Six Siege) 1.82배, CS:GO 1.72배: 이들 게임 타이틀의 게이밍 성능은 다음의 설정을 토대로 한 것임: 토탈워: 삼국지(Total War: Three Kingdoms): 1920x1080 해상도에서 “Battle” 및 “Dynasty V2” 벤치마크 시나리오 진행, 전체화면, V-Sync: 끔, 저화질 프리셋, 해상도 스케일링: 100%: 레인보우 식스 시즈(Rainbow Six Siege) – Y4S1: 1920x1080 해상도에서 “Suburban Extraction” 상황으로 5분 간 게임 플레이 진행, 전체화면, Vsync: 끔, 중간화질 프리셋, 측정 기준: PresentMon, 300Seconds; Counter-Strike: Global Offensive – 1.36.9.5: 1920x1080 해상도에서 Dust II 맵의 봇을 상대로 5분 간 게임 플레이 진행, 전체화면, 중간화질 프리셋, 멀티코어 렌더링: 활성화, FXAA: 비활성화, 텍스처 필터링 모드: Anisotropic 4X, Vsync: 끔. 구성: 인텔 프리프로덕션 시스템, (ICL-U), PL1=15W, 4C/8T, 터보 TBA 인텔 11세대 그래픽, 프리프로덕션 GFX 드라이버, 메모리: 8GB LPDDR4X-3733, 스토리지: Intel SSD Pro 760P 256GB,  OS: Microsoft Windows* 10 RS5 Build 475 비교대상: 인텔 프리프로덕션 시스템, WHL U. 구성: 인텔® 코어™ i7 8565U 1.8GHz, 최대 4.6GHz Turbo PL1=20W TDP, 4C/8T, Intel UHD Graphics 620, Graphics driver: 26.20.100.6709, 메모리: 16GB DDR4-2400, 스토리지: Intel SSD 760P 512GB,  OS: Microsoft Windows* 10 RS5 Build Version 475, 2019 5월 기준 인텔 측정 


2 IAXPRT 기준 아이스 레이크 AI 성능: 워크로드: ResNet-50에서 Int8 정밀도로 AIXPRT Community Preview 2 사용 시 초당 이미지 처리 7.6배 및 최대 AI 추론 처리량(throughput) 8.8배. ResNet-50 구성: 인텔 프리프로덕션 시스템, ICL-U, PL1=15W, 4C/8T, 터보 TBA, 인텔 11세대 그래픽, 프리프로덕션 GFX 드라이버, 메모리 8GB LPDDR4X-3733, 스토리지 Intel SSD Pro 760P 256GB, OS Microsoft Windows* 10, RS5 Build 475, 프리프로덕션 바이오스. 비교 대상: 기출시 OEM 시스템으로, AMD* 라이젠 7 3700U 2.3GHz Turbo (최대 4GHz 4C/8T), AMD* 라데온* 베가 10 그래픽, Adrenalin 2019 19.4.3 GFX 드라이버, 메모리 8GB DDR4-2400, 스토리지 SK Hynix BC501 256GB, OS – Microsoft Windows 10 RS5 Build 475 Bios F.07. 2019 5월 기준 인텔 측정. 


3 엔비디아* V100 GPU 대비 최대 2.41배 성능 우위: 2소켓 인텔® 제온® 플래티넘 8268 프로세서, 24코어 HT On Turbo ON 총 메모리 384 GB (12슬롯/ 32GB/ 2933 MHz), BIOS: SE5C620.86B.0D.01.0286.011120190816 (ucode:0x4000013), CentOS 7.6, Kernel 4.19.5-1.el7.elrepo.x86_64, SSD 1x INTEL SSDSC2KG96 960GB, 딥 러닝 프레임워크: MXNet https://github.com/apache/incubator-mxnet.git 커밋 f1de8e51999ce3acaa95538d21a91fe43a0286ec 적용대상 https://github.com/intel/optimized-models/blob/v1.0.2/mxnet/wide_deep_criteo/patch.diff, 컴파일러: gcc 6.3.1, MKL DNN version: 커밋: 08bd90cca77683dd5d1c98068cea8b92ed05784, Wide & Deep: https://github.com/intel/optimized-models/tree/v1.0.2/mxnet/wide_deep_criteo 커밋: c3e7cbde4209c3657ecb6c9a142f71c3672654a5, 데이터셋: Criteo Display Advertisement Challenge, 배치 크기=512, 2 인스턴스/2 소켓, 데이터타입: FP32; 추천 결과: 678,000 records /seconds. 비교대상: 호스트시스템: 2소켓 인텔® 제온® 플래티넘 8180 프로세서 (28코어), HT ON, 총 메모리 128 GB (16슬롯/8 GB/ 2666 MHz), Ubuntu 18.04.2 LTS  가속기: 엔비디아* 튜링 V100 GPU 가속기, 32GB HBM2, 32GB/sec Interconnect BW, 시스템 인터페이스 x16 PCIe 3세대, 드라이버 버전 410.78, CUDA 버전 10.0.130, CUDNN 버전 7.5, CUDA CUBLAS 10.0.130 딥 러닝 워크로드: MxNet 1.4.0https://pypi.org/project/mxnet-cu92/,  데이터타입:FP32, 배치 크기= 512, 2 인스턴트 구동 모델: Wide & Deep: https://github.com/intel/optimized-models/blob/master/mxnet/wide_deep_criteo/ model.py 현 상태에 대한 커밋 ID c3e7cbde4209c3657ecb6c9a142f71c3672654a5 트레이닝 데이터셋 (8,000,000 샘플):  wget https://storage.googleapis.com/dataset-uploader/criteo-kaggle/large_version /train.csv 평가 데이터셋 (2,000,000 샘플):  wget https://storage.googleapis.com/dataset-uploader/criteo-kaggle/large_version/eval.csv python3 inference.py --batch-size $bs  --num-batches 10000 >> $outdir/bs$bs-$runid.2xbgout 2>&1 & python3 inference.py --batch-size $bs  --num-batches 10000 >> $outdir/bs$bs-$runid.2xfgout 2>&1. 추천 결과: 281,211 records/second. 2019년 3월 인텔이 실시한 테스트 기준. 


https://arxiv.org/ftp/arxiv/papers/1704/1704.04760.pdf; https://research.fb.com/wp-ontent/uploads/2017/12/hpca-2018-facebook.pdf


5 인텔® 제온® 플래티넘 8180 프로세서(출시일: 2017년)와 비교 시, 인텔® DL 부스트로 최대 14배 AI 성능 향상. 2019년 2월 20일 인텔 테스트. 2소켓 인텔® 제온® 플래티넘 8280 프로세서, 28 코어 하이퍼스레딩 켬, 터보 켬, 총 메모리 384 GB (12 슬롯/32GB/2933 MHz), BIOS: SE5C620.86B.0D.01.0271.120720180605 (ucode: 0x200004d), Ubuntu 18.04. 1 LTS, 커널 4.15.0-45-일반, SSD 1x sda INTEL SSDSC2BA80 SSD 745.2GB, nvme1n1 인텔 SSDPE2KX040T7 SSD 3.7TB, 딥 러닝 프레임워크: Caffe용 인텔® 최적화 버전: 1.1.3 (commit hash: 7010334f159da247db3fe3a9d96a3116ca06b09a), ICC 버전 18.0.1, MKL DNN 버전 : v0.17 (commit hash: 830a10059a018cd2634d94195140cf2d8790a75a, 모델:https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt, BS=64, DummyData, 4인스턴스/2소켓, 데이터종류: INT8, 비교대상 2017년 7월 인텔에 의해 테스트됨: 2S 인텔® 제온® 플래티넘 8180 CPU @ 2.50GHz (28 코어), 하이퍼스레드 비활성화, 터보 비활성화, 인텔 pstate 드라이버를 통해 “성능”으로 설정된 스케일링 조정기, 384GB DDR4-2666 ECC RAM. CentOS 리눅스 릴리즈 7.3.1611 (코어), 리눅스 커널 3.10.0-514.10.2.el7.x86_64. SSD: 인텔 ® SSD DC S3700 시리즈 (800GB, 2.5인치 SATA 6Gb/s, 25nm, MLC). 측정된 성능: 환경 변수: KMP_AFFINITY='granularity=fine, compact’, OMP_NUM_THREADS=56, CPU 주파수 설정 cpupower 주파수-설정 -d 2.5G -u 3.8G -g 성능. Caffe: (http://github.com/intel/caffe/), revision f96b759f71b2281835f690af267158b82b150b5c. 추론은 "caffe time -forward_only"명령으로 측정되고 트레이닝은 "caffe time" 명령으로 측정됨. "ConvNet"토폴로지의 경우 더미 데이터셋이 사용됨. 다른 토폴로지의 경우 데이터는 로컬 스토리지에 저장되고 트레이닝 전 메모리에 캐시됨. 토폴로지 스펙은 https://github.com/intel/caffe/tree/master/models/intel_optimized_models(ResNet-50)에서 확인할 수 있음. 인텔 C++ 컴파일러 버전. 17.0.2 20170213, 인텔 MKL 소규모 라이브러리 버전 2018.0.20170425. Caffe는 "numactl -l"로 실행됨

 

 

 

유동식 기자 press@ruliweb.com




관련게임정보 목록

관련 정보

기     종

PC

발 매 일

장     르

가     격

제 작 사

인텔

기     타



댓글

BEST 뉴스

PC/온라인
비디오/콘솔
모바일
PC/온라인
비디오/콘솔
모바일
PC/온라인
비디오/콘솔
모바일

BEST 유저정보
콘솔
PC
모바일
취미
BEST 게시글
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티


X