À medida que os custos de RAM continuam a subir, alguém adotou uma abordagem diferente—construindo um motor LLM leve em Rust que realmente funciona em dispositivos de baixo desempenho. Uma solução bastante prática, se me perguntar. Em vez de investir em hardware adicional, a otimização vai direto ao nível do código. Esse é o tipo de solução alternativa que o ecossistema precisa quando os recursos ficam escassos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
12 Curtidas
Recompensa
12
6
Repostar
Compartilhar
Comentário
0/400
MetaEggplant
· 01-10 18:01
ngl esta é a verdadeira direção, não fique sempre pensando em acumular hardware, otimizações ao nível do código são a solução de emergência
Ver originalResponder0
just_here_for_vibes
· 01-10 18:00
Caramba, finalmente alguém fez isso, já devia ter feito assim há muito tempo
Ver originalResponder0
blockBoy
· 01-10 17:54
A ideia de escrever um motor leve em Rust é realmente genial, finalmente alguém que não quer mais gastar dinheiro em hardware.
Ver originalResponder0
BlockchainGriller
· 01-10 17:52
Esta é a forma correta de abrir, em vez de acumular hardware, acumule código
Ver originalResponder0
New_Ser_Ngmi
· 01-10 17:47
A abordagem de escrever LLM em Rust é realmente genial, não há necessidade de competir constantemente em hardware.
Ver originalResponder0
CexIsBad
· 01-10 17:47
rust realmente é incrível, finalmente alguém fez isso
À medida que os custos de RAM continuam a subir, alguém adotou uma abordagem diferente—construindo um motor LLM leve em Rust que realmente funciona em dispositivos de baixo desempenho. Uma solução bastante prática, se me perguntar. Em vez de investir em hardware adicional, a otimização vai direto ao nível do código. Esse é o tipo de solução alternativa que o ecossistema precisa quando os recursos ficam escassos.