엔비디아의 AI 최적화 드라이버 특허

본문

PC 정보

[참고] 엔비디아의 AI 최적화 드라이버 특허 [2]

TopSpoiler (656841)

활동내역 작성글 쪽지 마이피 타임라인

출석일수 : 5013일 | LV.65

Exp.20%

추천 1 | 조회 3247 | 비추력 35537

작성일 2023.01.09 (12:45:45)

IP : (IP보기클릭)221.147.***.***

프로필 열기/닫기

TopSpoiler (656841)

1 | 2 | 3247 | 비추력 35537

프로필 열기/닫기

2023.01.09 (12:45:45)

마지막 수정 시간: 23.01.09 12:56

주의:

이 특허가 루머의 AI 최적화 드라이버와 관련 없을 수도 있습니다.

MS번역

========

Real-time hardware-assisted GPU tuning using machine learning

기계 학습을 통한 실시간 하드웨어 기반 GPU 튜닝

상세 설명
본 발명의 실시예들은 특정 동작 파라미터들을 결정하기 위해 기계 학습을 적용함으로써 다중 처리 유닛의 실시간 동작을 개선한다. 일 실시예에서, 멀티프로세싱 유닛은 그래픽 처리 유닛(GPU)을 포함한다.

멀티프로세싱 유닛은 서로 다른 성능 관련 값을 실시간으로 측정하도록 구성된 논리 회로로 구성된 성능 모니터링 카운터(PM)를 포함한다. 일 실시예에서, PM들은 메모리 요청 카운터, 메모리 시스템 대역폭 이용, 메모리 시스템 저장 용량 이용률, 캐시 적중률, 멀티스레드 프로그램의 하나 이상의 스레드에 대해 클록 사이클 당 실행된 명령어의 카운트, 및 멀티스레드 프로그램의 하나 이상의 스레드에 대해 실행된 명령어의 카운트 중 적어도 하나를 모니터링하도록 구성될 수 있다. 더욱이, PM은 프로세싱 코어에 대해 그려진 픽셀들에 대한 값, 음영처리된 픽셀들 및/또는 프리미티브들의 카운트, 터치된 스크린 타일들, 현재의 클럭 레이트들, 및 메모리 및/또는 산술 연산들의 카운트들을 모니터링하도록 구성될 수 있다. PM은 결과 모니터 값을 실시간으로 보고하거나 PM은 구조화된 액세스 회로를 통해 모니터 값을 보고할 수 있습니다. 더욱이, 멀티프로세싱 유닛은 멀티프로세싱 유닛이 동작을 수행하는 방법을 결정하는 하나 이상의 상이한 동작 파라미터에 따라 동작하도록 구성될 수 있지만, 그렇지 않으면 동작의 최종 결과를 변경하지 않는다. 예를 들어, 오퍼레이팅 파라미터는 동시에 실행되는 관련 스레드의 최대 수(예를 들어, 동시성의 정도)를 특정할 수 있다. 운영 파라미터는 타일 캐싱 또는 다양한 다른 형태의 캐싱 또는 캐싱 정책을 활성화할지 여부를 지정할 수 있습니다. 또한, 동작 파라미터는 코어 클럭 주파수, 메모리 인터페이스 클럭 주파수 등을 특정할 수 있다.

다양한 PM 값에 응답하여 작동 파라미터를 튜닝하면 멀티프로세싱 장치의 처리량 및/또는 전력 효율을 향상시킬 수 있습니다. 주어진 다중 처리 장치에는 수천 개의 PM과 다중 처리 장치의 작동을 조정하기 위해 변경할 수 있는 여러 가지 작동 매개 변수가 포함될 수 있습니다. 선행 기술 휴리스틱 기반 솔루션은 일반적으로 실시간으로 작동 할 수 없으며, 제한된 워크로드 및 매개 변수 세트를 기반으로 하드 코딩되는 경향이 있으며, 동적으로 업데이트 할 수 없으며, 특정 응용 프로그램 (예 : 다중 스레드 응용 프로그램)에 대한 다중 처리 장치 작업을 효과적으로 조정하기 위해 두드러진 PM 값 및 기타 상태 데이터를 선택하고 활용하지 못할 수 있습니다. 대조적으로, 기계 학습 기술을 적용하여 작동 매개 변수를 결정하고 작동 목표와 더 높은 상관 관계를 갖는 PM 값을 선택 및 적절하게 활용하고 다른 상태 데이터를 원활하게 통합하여 작동 매개 변수를보다 효과적으로 조정할 수 있습니다. 신경망 기반 접근 방식을 구현하는 기계 학습 접근 방식은 계산 비용과 대기 시간을 모두 고려하는 제약 조건을 기반으로 효율성 및/또는 최적의 PM 값 또는 기능 집합을 선택할 수 있습니다. 더욱이, PM 값들(및 다른 관련 입력들)에 기초하여 동작 파라미터들을 결정하기 위해 구현된 신경망은 실시간으로 동작할 수 있고, 동적으로 업데이트될 수 있다.

다중 처리 장치에서 실행되는 지정된 응용 프로그램에는 시간이 지남에 따라 리소스 사용률이 다양하여 실행 중에 다양한 PM 값이 발생하는 특정 작업 프로필을 가질 수 있습니다. 신경망 서브시스템은 멀티프로세싱 유닛으로부터 PM 값들을 수신하고, 또한 어플리케이션 상태, 현재 동작 파라미터 상태, 및 멀티프로세싱 유닛에 대한 드라이버 큐들을 포함하는 하나 이상의 형태의 다른 상태 데이터를 수신할 수 있다. 신경망 서브시스템은 다중 처리 장치로 다시 전송되는 동작 파라미터를 생성합니다. 애플리케이션이 진행되고 애플리케이션 실행 과정에서 PM 값이 변경되면 신경망은 다중 처리 장치의 지속적인 작동을 조정하기 위해 작동 매개 변수를 업데이트하여 응답합니다.

신경망은 주어진 애플리케이션의 실행을 위한 모델 파라미터를 생성하기 위해 개별적으로(예를 들어, 오프라인으로) 훈련될 수 있다. 상이한 애플리케이션들은 상이한 모델 파라미터들(예를 들어, 중량들 및/또는 활성화들)을 가질 수 있다. 또한 지정된 응용 프로그램의 다른 부분은 다른 모델 매개 변수를 가질 수 있습니다. 모델 파라미터는 애플리케이션을 시작하기 전에 신경망 서브시스템에 로드될 수 있으며, 모델 파라미터는 애플리케이션이 실행될 때 업데이트될 수 있다.

모델 파라미터들은 각각의 상이한 애플리케이션에 대한 신경망 서브시스템의 오프라인 트레이닝 동안에 결정될 수 있고, 잠재적으로 주어진 애플리케이션의 각각의 상이한 동작 모드(예를 들어, 게임 레벨)에 대해 결정될 수 있다. 또한 강화 모델을 사용하면 지정된 응용 프로그램의 런타임 동안 모델 매개 변수를 추가로 훈련할 수 있습니다.

======

요약:

기존 방식(현재의 게임 레디 드라이버):

- 사람의 손에 의해

- 제한적인 성능 파라미터를

- 하드코딩하였으나

특허 방식:

- 머신러닝에 의해

- 광범위한 성능 파라미터를

- 오프라인 훈련 또는 실시간 훈련 및 적용

출처 : https://www.freepatentsonline.com/11481950.html

글쓰기

댓글 | 총 2 개

위치결정 (395857) (IP보기클릭)211.51.*.*	오토튜닝의 시대인것인가.. 등록	23.01.09 12:53
웹떠돌이 (174967) (IP보기클릭)223.62.*.*	오토 성능업은 암드 아드레날린 드라이버도 있는데 자동 오버클러킹. 등록	23.01.11 16:18

로그인이 필요합니다.

글쓰기

공지

스킨

인증글 베스트

ID	구분	제목	글쓴이	추천	조회	날짜
352195	공지	국내외 언론 및 웹진 불펌 금지. (2)	관리자	6	207644	2010.06.22

2325762	S/W	사람 말 안 듣기 시작?...AI, 처음으로 인간 지시 (8)	원히트원더-미국춤™		2257	2025.05.27
2325759	H/W	엔비디아, K특허 침해했나? "수천억 로열티 수익 가능"	뒤돌아 보지마	5	2777	2025.05.27
2325748	H/W	스팀OS 탑재된 레노버 리전 고, 동일한 윈도우버전보다 우위 (20)	Taliss	7	7051	2025.05.27
2325747	ETC	‘어린이 포털’ 쥬니어네이버, 26년 만에 문 닫는다 (9)	팔자™	7	2921	2025.05.27
2325745	S/W	'AI 군사적 이용' 반대 시위 잇따라...MS·구글 행사에서 이스라엘과 (18)	원히트원더-미국춤™	8	3003	2025.05.27
2325741	루머	CUDIMMS : AMD의 다음 CPU는 더 빠른 메모리를 지원합니다 (13)	스퀴니	9	5081	2025.05.27
2325734	ETC	에버미디어, CAMO Studio와 협업, 이동형 스트리밍 환경 제시	홀리데이321		756	2025.05.27
2325699	S/W	구글, “AI 학습 거부하면 검색 결과에서 제외할 것” (3)	잘_살면_좋아	19	5006	2025.05.26
2325696	ETC	국내 최대 저작권 침해 사이트 누누티비 운영자 징역 3년(종합) (15)	팔자™	8	7515	2025.05.26
2325695	ETC	오픈AI, 한국법인 세우고 韓공식 진출…조만간 서울에 사무소 (7)	팔자™	15	5348	2025.05.26
2325691	H/W	게이브 뉴웰, 뇌에 칩 이식하는 기술 발표 (34)	헤롱싀	24	12916	2025.05.26
2325686	H/W	엔비디아 RTX 5060, 출시 직후 ‘블랙스크린·시스템 다운’ 논란 (42)	춘리허벅지	15	12718	2025.05.26
2325685	S/W	윈도우10 지원 종료 임박…유저들의 이별 준비는 '아직' (24)	춘리허벅지	1	4659	2025.05.26
2325674	ETC	삼성의 HBM3E 엔비디아 승인이 가까워졌지만 여전히 주문전망은 의심이 ... (14)	Taliss	6	7952	2025.05.25
2325672	H/W	엔비디아, 중국용 ‘블랙웰’ AI칩 출시…가격 30% 인하 (8)	뒤돌아 보지마	6	6440	2025.05.25
2325654	H/W	‘전기 먹는 하마’ 데이터센터…아일랜드의 ‘전력 딜레마’ (17)	원히트원더-미국춤™	3	3413	2025.05.25
2325648	S/W	X(트위터) 다운 (10)	키키™	16	10377	2025.05.24
2325643	H/W	스팀OS, 레노버 리전 고 S 공식 지원…생태계 확장 시동 (29)	뒤돌아 보지마	12	12767	2025.05.24
2325640	S/W	"이번엔 다르다"…SK텔레콤 해커들이 노리는 건 (3)	뒤돌아 보지마	3	3842	2025.05.24
2325639	S/W	IP 추적해 보니 '소름'…"SKT 서버 해킹 시작은 북한" (60)	뒤돌아 보지마	7	12200	2025.05.24
2325637	ETC	AMD, 대부분의 1080p 게이머들은 8기가로 충분하다며 9060 XT... (84)	Taliss	4	14904	2025.05.24
2325633	ETC	“실제 대화 같아”vs“끄고 싶어” UX 관점에서 본 카카오톡 ‘입력 중... (7)	에루디토	1	3554	2025.05.24
2325619	ETC	Starfish Neuroscience의 초소형 저전력 BCI 칩 개발 ... (1)	왜날뾁에올인	1	847	2025.05.24
2325609	H/W	라이젠 & 라데온의 원조 맛집, ASRock - 컴퓨텍스 2025 부스를... (7)	춘리허벅지	1	2504	2025.05.23
2325590	ETC	엔비디아 CEO, 반도체 생산은 TSMC 이외에 대안이 없다	Taliss	6	3500	2025.05.23
2325568	ETC	카카오, 자체 AI 모델 '카나나 1.5' 4종 오픈소스로 공개 (1)	팔자™	2	1408	2025.05.23
2325567	ETC	네이버, 다음 달 '뉴스제휴위원회' 출범 (4)	팔자™		929	2025.05.23
2325566	ETC	삼성 반도체 경영진단 막바지…파운드리도 분할 가능성	Taliss		1630	2025.05.23

글쓰기 총 54931개의 글이 있습니다.

인증글 베스트 목록

1 2 3 4 5 6 7 8 9 10

본문

PC 정보

PC 게임 정보

예판/핫딜 정보

조립/견적

모니터

노트북/데스크탑

기타/주변기기

소프트웨어

EPIC/스팀/패키지

온라인 게임

게임 소감

게임 추천

인디게임 게시판

VR게임 게시판

패키지게임 스샷

패키지게임 영상

온라인게임 스샷

온라인게임 영상

게임 방송

성인게임 스샷

성인게임 영상

PC 정보

[참고] 엔비디아의 AI 최적화 드라이버 특허 [2]