Menurut laporan Science and Technology Innovation Board Daily pada tanggal 14 September, pada Global AI Chip Summit 2023, Direktur Teknis Solusi dan Arsitektur NVIDIA Zhang Ruihua memperkenalkan perangkat lunak open source terbaru NVIDIA TensorRT-LLM. Dia mengatakan bahwa TensorRT-LLM pada dasarnya dapat menyelesaikan masalah masalah saat ini. Tantangannya mencakup pengembangan model yang cepat, pembaruan yang sering, dan jumlah pengguna yang besar. Perangkat lunak ini mendukung multi-node GPU dan mudah diprogram. Dikombinasikan dengan Triton, perangkat lunak ini dapat mengurangi masalah latensi multi-pengguna, sehingga memanfaatkan sepenuhnya GPU dan mengurangi biaya. Untuk pelatihan model besar, NVIDIA juga mengusulkan NeMo Framework, yang merupakan kerangka pelatihan end-to-end dan cloud-native untuk membangun, menyesuaikan, dan menerapkan model AI generatif, yang pada dasarnya mencakup seluruh siklus hidup pelatihan model besar. . Untuk mencegah model besar mengoceh, NVIDIA juga menyediakan fungsi pagar pengaman (Guardrails) untuk membantu model besar menggeneralisasi pengetahuan dengan lebih baik. Zhang Ruihua percaya bahwa model AI memiliki ruang pengguna yang besar. Di masa depan, model tersebut tidak hanya akan ada di lembaga penelitian, tetapi dapat menjadi aplikasi di ponsel atau komputer semua orang.