
用量增长,这是两种芯片的硬件架构决定的。我们只能痛苦地权衡体验和成本,比如别让图片渲染得特别大,把计算量大的任务放到半夜跑,让用户等一个晚上等等。 晚点:这不能通过弹性调度等技术优化吗? 黄晓煌:不可能像 CPU 那样做到几倍的优化,通常就是优化百分之几十。所以 CPU 和 SaaS 时代的产品都是包年、包月计费;但 GPU 和模型时代都是按 token 和用量付费。 类似的,我们也尝试过广
当前文章:http://j3ce.nuolushen.cn/hkwj/e66f.htm
发布时间:01:39:49

