从手写数字识别入门深度学习丨MNIST数据集详解

就像无数人从敲下“Hello World”开始代码之旅一样,许多研究员从“MNIST数据集”开启了人工智能的探索之路。MNIST数据集(Mixed National Institute of Standards and Technology database)是一个用来训练各种图像处理系统的二进制图
2024年05月31日 450次浏览

聊聊分布式散列表(DHT)的原理 — — 以 Kademlia(Kad) 和 Chord 为例

什么是“散列/哈希(hash)”?(注:在本文中,凡是提及“散列”或“哈希”或“hash”,均表示相同含义)关于 hash 的概念,俺曾经写过一篇相关的扫盲教程《扫盲文件完整性校验 — — 关于散列值和数字签名》,不了解此概念的同学,可以先看看。老实说,如果你还没有搞明白 hash 的概念,就不要浪
算法 2021年07月31日 900次浏览

海量数据的TOPK问题

1. 抛出问题在大规模数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最好的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题。例如,在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载最高的前10首歌等。针对top K类问题,通常比较好的方案是分治+
2021年04月21日 815次浏览

数据结构之大顶堆小顶堆

这是我当初拍的自己的课本23333,我觉得这部书说堆说的还挺清楚的,恰巧这个数据结构不太常用,列出来备忘
2021年04月21日 523次浏览

附近的人常用算法之Geohash算法

最近需要实现一个功能,查找车辆附近的加油站,如果车和加油站距离在200米以内,则查找成功。加油站数量肯定不小,能否缩小查找范围,否则以遍历形式,效率肯定高不了。Geohash算法就是将经纬度编码,将二维变一维,给地址位置分区的一种算法。基本原理GeoHash是一种地址编码方法。他能够把二维的空间经纬
2020年11月24日 1,129次浏览