본문

글쓰기   목록 | 이전글 | 다음글

[S/W] 화웨이, LLM 경량화 기술 ‘SINQ’ 오픈 공개"메모리 사용 70%까지 절감" [4]


profile_image_default
(1076219)
2 | 4 | 804 | 비추력 926085
프로필 열기/닫기
글쓰기
|
목록 | 이전글 | 다음글

댓글 | 4
1
 댓글


(IP보기클릭)220.81.***.***

씽큐...
25.10.06 23:00

(IP보기클릭)210.179.***.***

한국인이 화웨이 하드웨어 쓰는 서버로 호스팅하는 AI 쓸 일이 거의 없긴 하겠지만, 엔비디아한테 과도하게 쏠린 수요를 최소한 중화권 한정으로라도 분산시키는 역할을 한다는 점에서 좋게 봄.
25.10.06 23:03

(IP보기클릭)221.163.***.***

이제 블랙웰gpu에 더 어마무시한 모델을 올려서 서빙하겠군요.
25.10.06 23:39

(IP보기클릭)211.200.***.***

검색헤서 대충보니까 추론하곤 상관 없는거 같고 양자화할때 빠르고 손실 없다는거 같은데 그것도 8비트인거 같던데요. 기대에차서 찾아보니 내 생각과는 좀 다른 느낌임. 거보다 moe 모델 필요할때 활성 전문가만 vram에 올릴수 있으면 개인용도로 큰 모델 올릴수 있을듯 지금은 안써도 몽창 다 올려야해서 좀 아쉬움
25.10.06 23:46


1
 댓글




목록 | 이전글 | 다음글
>
ID 구분 제목 글쓴이 추천 조회 날짜
352195 공지 국내외 언론 및 웹진 불펌 금지. (2) 관리자 6 221870 2010.06.22
2334301 S/W 뒤돌아 보지마 876 17:01
2334300 H/W 로메오카이 923 16:44
2334298 S/W 사쿠라모리 카오리P 405 16:36
2334297 S/W 사쿠라모리 카오리P 424 16:35
2334296 ETC 사쿠라모리 카오리P 179 16:34
2334294 S/W 사쿠라모리 카오리P 417 16:30
2334293 ETC 사쿠라모리 카오리P 336 16:30
2334285 ETC 팔자™ 4 2759 13:28
2334284 ETC Taliss 3 1626 12:20
2334249 H/W 사쿠라모리 카오리P 931 2025.10.06
2334248 S/W 사쿠라모리 카오리P 1 789 2025.10.06
2334247 S/W 사쿠라모리 카오리P 2 804 2025.10.06
2334245 ETC 사쿠라모리 카오리P 608 2025.10.06
2334244 ETC 사쿠라모리 카오리P 2 788 2025.10.06
2334243 S/W 사쿠라모리 카오리P 2 367 2025.10.06
2334242 H/W 사쿠라모리 카오리P 2 808 2025.10.06
2334238 S/W echospherics 16 8788 2025.10.06
2334237 ETC 대한제국군 2 2712 2025.10.06
2334235 ETC 사쿠라모리 카오리P 2 3632 2025.10.06
2334234 ETC 사쿠라모리 카오리P 1 729 2025.10.06
2334231 ETC 사쿠라모리 카오리P 6 3388 2025.10.06
2334229 ETC 사쿠라모리 카오리P 3 1001 2025.10.06
2334228 S/W 사쿠라모리 카오리P 722 2025.10.06
2334227 ETC 사쿠라모리 카오리P 2 595 2025.10.06
2334222 ETC a323 4 2292 2025.10.06
2334219 ETC 사쿠라모리 카오리P 1 1374 2025.10.06
2334206 ETC 사쿠라모리 카오리P 1 1136 2025.10.05
2334205 ETC 사쿠라모리 카오리P 12 7353 2025.10.05
글쓰기 54803개의 글이 있습니다.
1 2 3 4 5 6 7 8 9 10
X