大约 9 分钟
Embedding 本质是一个查询矩阵,或者说是一个 dict 数据结构。以词向量为例, Embedding dict 的 Key 是词在词表中的索引位置(Index),Embedding dict 的 Value 是这个词的 `dim` 维的向量。
大约 7 分钟
AlphaCode的原理主要是生成了海量的候选答案,最后筛选出正确的答案。
大约 8 分钟
大约 2 分钟
`/dev/shm`是一个特殊的目录,它表示是一块共享内存(Share Memory)。这个目录可以用来在进程间进行数据的通信和共享。默认情况下,Docker容器启动后`/dev/shm`只有64M!高性能计算场景需要设置一个更大的值。
大约 2 分钟
从faker.js删库,谈谈开源软件的白嫖与商业模式
大约 5 分钟
使用Linear+Warmup+Decay方法调整学习率
大约 3 分钟
神经机器翻译中需要对原始文本使用Tokenizer分词,并使用BPE工具生成subword子词。
大约 5 分钟
联邦学习本质上是一种加密的分布式机器学习,允许不同机构在本地利用自有数据进行机器学习,共同建立机器学习模型,以应对越来越严格的隐私监管。
大约 9 分钟
动态链接与静态链接有什么区别?so文件到底是干嘛的?Linux上的动态链接库如何命名?编程时如何链接?
大约 10 分钟