画画太岁 作品

第258章 怎么总感觉是在给自己挖坑呢(第二更!)(第3页)

 实在不行,就上阿狸云呗,算起来比自己建数据中心便宜多了。

 华泽成并不负责数据中心的整体规划和优化,对y系列的数据中心有多强大一无所知。

 听到啊华泽成的抱怨,方豫也很无奈。

 前几天他让柚子去英伟达的服务器上看一下,p100到底什么时候才能发货。

 结果柚子去转了一圈之后回来告诉他,至少还得六个月,这还是它乐观估计。

 按照目前它观测到的英伟达的工作效率,估计得一年了。

 这个号称采用了hbn),取而代之的是完全不同的注意力机制以及编码器-解码器架构。

 值得注意的是,openai中的伊利亚并不是这篇文章的作者之一的伊利亚波洛苏金。

 这篇文章在17年6月12日发布后,并没有第一时间造成很大影响,并且由于其难以收敛,并不比相对成熟的lstm效率更高,因此在这个阶段,大部分研究者的视线并未投向注意力机制的transformer架构,这里也包括openai。

 openai在2018年年初,还在用lstm进行训练,并且在dota2里击败了人类。而仅仅几个月之后,openai就发布了gpt-1。

 这说明,几个月的时间,足够制作一个大模型。