Paper Reading 更新 | 看看大家都在读哪些 Paper ?

先前在唠嗑专区问了大家有没有让大家惊呼有用 & 忍不住拍大腿的 Paper。看到大家的评论发现用【学无止境】来形容再合适不过。乘此机会我也私下找了几个社区用户聊聊他们读 Paper 的学习路径,大家可以先从哪些 Paper 入门,读 Paper 的过程中有哪些思考。

入坑” Paper 的原因,当时为啥就开始读 Paper了呢?

@pupillord:做项目时需要学习算法原理,就开始了源码探索的不归路

@xfworld:不需要原因,学习抽象和理解的能力,就是论证和辩论的能力!


个人推荐的一些 paper 获取路径?

@pupillord:搜索引擎,github上他人写的一些笔记,博客或者官方文档也会有 Paper 的原文提供

@xfworld:根据自己想了解的内容去搜索,不固定,paper其实蛮常见的,看个人所需直接搜!


读 Paper 你觉得要具备哪些基本条件

@pupillord:学习英文吧!

@xfworld:英文!这也是个加强锻炼的机会


大家都说 Paper 很难“啃”,让你坚持去看的原因是什么

@pupillord:只有自己读懂了,才能说去分享给别人,不然是无法讲清楚的

@xfworld:对于论文背景的一些设想,以及论点的深度理解,会给自己带来更多的收获


读 Paper 不仅可以帮助自己去了解技术背后的原理,在读的过程中也是不断提升逻辑思考和辩证能力的学习体验。 这是采访完一些喜欢 Paper 阅读的小伙伴得出的一点小小总结,未来也希望有越来越多的小伙伴能加入到 Paper Reading 的队伍里,虽然这是个小众爱好,但总有一些小伙伴在坚定不移得热爱着!

TiDB 社区中也有不少喜欢看看 Paper,讨论前沿技术的小伙伴,整理了一些 TiDB 小伙伴们提到的一些经典论文合集,如果你也喜欢读 Paper,并且想跟大家一起交流,可以在评论区留言

我最近在读的Paper:
推荐给大家的理由:

参与评论即可获得 100 积分,100经验值
(此贴长期有效,Paper 爱好者们都可以来这里分享你们的 Paper 心得~)


【大家推荐的Paper 合集】

一些经典的 Paper 实实在在的引领的一些新兴技术的发展,就好比分布式数据库,TiDB 的诞生就来自于几个工程师对 Google Spanner 论文的研读和创新~

Dynamic Programming Strikes Back.pdf (386.2 KB)
Fast Serializable Multi-Version Concurrency Control for Main-Memory Database Systems.pdf (2.1 MB)
In Search of an Understandable Consensus Algorithm.pdf (554.2 KB)
MonetDBX100.pdf (242.6 KB)
The BW-Tree A Latch-Free B-Tree.pdf (171.7 KB)
Volcano-An Extensible and Parallel Query.pdf (4.5 MB)
Spanner.pdf (357.8 KB)
Calvin Fast Distributed Transactions.pdf (531.3 KB)
The Algorithm…t Interaction_Iakov SKorovin.pdf (1.0 MB) DCAD_aDualClusteringAlgorithmforDistributedSpatialDatabases.pdf (626.6 KB)
Design of par…lash database_Ying Li.pdf (1.1 MB)
A Transaction…uted Database_Zhian Lin.pdf (1.9 MB)
Research on M…ment Database_XIONG Xin.pdf (736.9 KB)
A Distributed…Immune Theory_Ming Yao.pdf (564.6 KB)
An Efficient …ta Processing_Qiao SUN.pdf (930.8 KB) Schedulingtransactionsinmobiledistributedreal-timedatabasesystems.pdf (365.1 KB)
A Comprehensive Risk Management.pdf (5.9 MB)
TideDB-A Dist…ries Database_Xue Yingfei.pdf (419.1 KB)
无锁DB.pdf (621.5 KB)


【Paper 解读资料专区】

第一期:《Volcano-An Extensible and Parallel Query Evaluation System》 By 江坤老师 @pupillord

火山模型与TiDB.pdf (1.3 MB)
视频回放:https://www.bilibili.com/video/BV1bv4y1M7mE/

第二期:《A Hybrid Database for Transactional and Analytical Workloads》By @阿福Chris
Paper Reading - A Hybrid Database for Transactional and Analytical Workloads.pdf (749.6 KB)
Greenplum论文.pdf (5.3 MB)
视频回放:https://www.bilibili.com/video/BV1Ft4y1t7N9

第三期:《F1: A Distributed SQL Database That Scales》 By 陈博钏
F1- A Distributed SQL Database That Scales.pdf (405.8 KB)

第四期:《Mercury: Hybrid Centralized and Distributed Scheduling in Large Shared Clusters》 By 王维真

资料下载:https://www.usenix.org/system/files/conference/atc15/atc15-paper-karanasos.pdf
视频回放:https://www.bilibili.com/video/BV13e4y1H7p1/


Paper Reading 系列也为大家随时敞开大门,跟大家来一场云夜话 Paper!

成为 Paper Reading 的分享作者可以获得:

  • 500 积分 500经验值
  • 计入 MOA/MVA 布道记录
  • TiDB 限量周边盲盒礼包(其中包括Ti 合金键帽、卡带复古移动充、自动晴雨伞、鼠标垫、小米屏幕挂灯、双肩背包等随机礼包)

2赞

我最近在读的Paper:Greenplum在SIGMOD2021上发表的HTAP的论文《Greenplum: A Hybrid Database for Transactional and Analytical Workloads.》
推荐给大家的理由:Greenplum是一款强分析型数据库,VMWare的工程严谨性,造就了Greenplum的稳定可靠,GP在HTAP上也在不断的探索,所以这篇论文论述了GP在TP方面的努力,可能会对一些小伙伴有所启示。

3赞

Greenplum论文.pdf (5.3 MB)

2赞

无聊的新手小菜鸟又回来灌水了!
我最近在读的Paper:The Design of Any-scale Serverless Infrastructure with Rich Consistency Guarantees
推荐给大家的理由:文章开发了构建无服务器基础设施的设计原则,可以实现卓越的性能、平滑无缝的可扩展性以及丰富的一致性保证。基于格的无协调一致性和LDPC(逻辑分解与物理并置)。通过对一致性的形式保证,以及Anna键值存储数据库和Cloudburst无服务器计算系统实现的性能和可扩展性,这些想法得到了验证。论文还展示了机器学习模型服务、社交网络和机器人等领域的应用。
The Design of Any-scale Serverless Infrastructure with Rich.pdf (3.2 MB)

4赞

:+1:

2赞

我最近在读的Paper: FoundationDB: A Distributed Unbundled Transactional Key Value Store
推荐给大家的理由:FoundationDB是一个开源分布式KV系统,面向OLTP型负载。与其他分布式KV不同 的是它支持多个key的ACID事务语义。它将事务系统/日志系统/存储系统进行解耦的设计,因此可以分别扩展读能力和写能力。为了系统的正确性而设计了确定性模拟器 可以设计和复现复杂的分布式corner case。目前FoundationDB应用在Apple的CloudKit/底层存储,Snowflake的元数据存储,由于支持完成的ACID被CouchDB用 于索引的存储等。
FoundationDB A Distributed Unbundled Transactional Key Value Store.pdf (1.6 MB)

1赞

向大家学习

1赞

我最近在读的Paper:《TiDB: A Raft-based HTAP Database》
推荐给大家的理由:经典值得反复读。

2赞

只能在角落默默看着各位大神。。。。。不敢说话

来,近大神者大神也!

菜鸟朝拜大佬, 英文差有些好难啃 哈

1赞

我来分享下:
bdb-je-architecture-whitepaper-366830.pdf (566.2 KB)

Berkeley DB Java Edition (JE)是一个完全用JAVA写的,它适合于管理海量的,简单的数据。
l 能够高效率的处理1到1百万条记录,制约JE数据库的往往是硬件系统,而不是JE本身。
l 多线程支持,JE使用超时的方式来处理线程间的死琐问题。
l Database都采用简单的key/value对应的形式。
l 事务支持。
l 允许创建二级库。这样我们就可以方便的使用一级key,二级key来访问我们的数据。
l 支持RAM缓冲,这样就能减少频繁的IO操作。
l 支持日志。
l 数据备份和恢复。
l 游标支持。


2赞

进来学习下

1赞

8月来不来!

[/quote]PolarDB Serverless

听了官方的Talent Plan相关一些课分享,下载学习了解下国内目前比较火的云原生数据库,来自国内技术大咖自研的内存与计算存储解耦 [PolarDB Serverless],希望tidb等登陆国内的云商服务方便用户更加便捷的使用

1赞

这个FoundationDB据说牛的很啊。。。。

1赞

去哪儿浪? 8月

线上的paper reading :clap: