(因最近出现DeepSeek就在“大数据”这页上加入点评注:DeepSeek成立于2023年7月17日,开头说:“使用数据蒸馏技术,得到更为精炼、有用的数据”。这么个技术美国等也能搞,而且美国众多世界级顶尖公司搞了那么多年类似的技术应不比DeepSeek差。我认为DeepSeek能如此这般纵横天下的关键是中国不仅是世界第一数据大国而且它本身具有它很多独特而美国又不能形成集群的对真实世界的描述起到更趋于完整真实作用的数据集群--不过若乌克兰和美国合作开发矿产等资源成万亿肯定驻军-那美军和俄军就互相顾忌-这压迫会使俄罗斯也只好求和美国合作开发则后果不堪设想-那我国改不改变放点权/法律才出点胎适应点世界可都已难当老大并如此的老二的数据将大打折扣--早点搞经济科技制约些美国它也没这么大的余威-现在就看特朗普敢冒险否以及普金愿亏些和美国合作否-还有欧洲也已沦为不平等的小二若接受也凑合否则中国能否取代美国)当然这个要论证有些复杂-如数据这么一个很基本简单的东西是否有必要重问它应是什么?是否要先弄清在人工智能作用中它们来自于不同的地方国家是否有主次等差别-即同类数据因表征不甚同的肤色习俗行为思想意向等-那数据大国的更起决定性?这个问题是否存在?我已很久没有心情关心AI已离得很远--不好论证也因人工智能核心要素非单一因而我这个仅是一个观点。当然数据是极其关键的才提出这观点-因机器人硬件与大模型软件之间实际上是一个采集数据支撑智能,智能又赋能机器让它更聪明的这么个闭环过程,如此数据起很关键作用。(刚又再见下面海南琼州大学的导师去担任访问教授的大学数学系的美国历史上最伟大的国际奥数之王乔丹•艾伦伯格十年前写了《魔鬼数学:大数据时代,数学思维的力量》后,现又出版《几何学的力量》,就如这文章“风靡全球的ChatGPT底层语言逻辑是几何学”中说‘通过《几何学的力量》这本书,乔丹·艾伦伯格带领我们展开了一场串联了数学与经济、人工智能等广泛现实生活事件的探索之旅’)。
大数据(大数据时代已经来临,这领域与随机矩阵及数据优化有关):
关于这领域,可参考海南琼州大学的导师柳柏濂教授去与其合作几年诞生教育部通过的中国“第一本”数学研究生用书的威斯康星大学的刚毕业于哈佛大学的年轻教授Jordan
S. Ellenberg乔丹·艾伦伯格的《How Not to Be Wrong: The Power
of Mathematical Thinking》刚见译为《魔鬼数学:大数据时代,数学思维的力量》(这威斯康星大学教授Jordan S.
Ellenberg乔丹·艾伦伯格参加3次国际数学奥林匹克竞赛获得1987年和1989年2届42分都是以满分拿金奖及1988年31分居于前18名的银奖-但这1988年31分的仍居美国第一名--即他这3次都是美国第一名这可能是美国历史上最好成绩的人(国外是凭兴趣因此成绩可很好但满分不多而我国是集中起来长期高强度培训因此我国一参加几乎都是第一)。在他威斯康星大学数学系的个人网页,见他在1992年会议发表了我们海南琼州大学在中国第一个组合数学研究室攻关的领域的组合数学论文The
combinatorics of rewritability in finite groups是与1987年的另一满分Eric K. Wepsic合作-不过Wepsic在1988年考到60名相对感到落差大才不读数学吧,他在世界第一杂志AM的Serre's
conjecture over F9特别是The
number of extensions of a number field with fixed degree and bounded
discriminant是和刚获得菲尔茨奖的Akshay Venkatesh合作的论文都值得一读并Akshay Venkatesh的第一篇论文Finite
locally-quasiprimitive graphs. Formal power series and algebraic combinatorics也是组合数学的而Akshay Venkatesh仅获得国际数学奥林匹克竞赛居于前102名的铜奖-当然各人参赛的准备程度不同)。
关于这些国际数学奥林匹克竞赛生如此厉害就如这里北大数院的“高考状元都成了被竞赛生碾压的学渣”-这就在于他们花更多时间做得更深更广不只是同一层次上远超那些满分更是超出几个层次如此更夸张得离奇的是传北大数院的人常说“你一个高考状元也想进数院”。
最近大数据很热,如此我也搞到下面书籍: 阿莱克斯·彭特兰(Alex Pentland)的《大数据与社会物理学》; 维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger)、肯尼斯·库克耶(Kenneth Cukier)的《大数据时代》,以及他俩还再合写《与大数据同行》一书; 拉里·罗森伯格(Larry Rosenberger)、约翰·纳什(John Nash)和安·格雷厄姆(Ann Graham)的《大数据时代的预测分析和决策管理》; Bill Franks的《驾驭大数据》;克里斯塔基斯(Nicholas A. Christakis)、富勒(James H. Fowler)的《大连接》; 巴拉巴西(Albert-Laszlo Barabasi)的《链接》,以及他再写的《爆发》; 我也有哈佛大学2个权威David C. Hoaglin和Frederick
Mosteller与被誉为“数据科学之父”的他俩的导师John
W. Tukey合撰的《探索性数据分析》的很许多方法思想技术等对大数据分析有参考启发价值;阿里巴巴集团副总裁车品觉的《决战大数据》; 姚宏宇、田溯宁的《大数据时代的系统工程》,等等。
可参考央视的《大数据时代》记录片第一集,第二集、第三集、第四集、第五集; 相关领域可参考这页的更多相关领域或参考这网页。
最近都说中国将很快成世界第一数据大国,并上面著作都说大数据的作用是多方面全方位的尤其对早在1993年清华大学就邀请我去做的人工智能的驱动作用是飞跃性的并它们的作用是互相的深远的将成为推动各行各业创新与变革的重要动力。
除了清华,刚见北京大学牵头联合中国科学院、中山大学、中国信息安全研究院等最近成立“大数据分析与应用技术国家工程实验室”并主任张平文校长就是称海南琼州大学是“魔鬼天才”的北大状元侯教授的北大数学系同年级同学;
隔年,又见海南琼州大学世界领先的哈密顿图领域的专家邓小铁院士担任中心执行主任的“北京大学前沿计算研究中心”竟有3个计算机诺贝尔奖得主担任教师并其中John
Hopcroft开设为期两周的暑期课程“信息科学中的数学”,就使用Avrim Blum,John Hopcroft和 Ravindran
Kannan合编的《Foundations of Data Science数据科学基础》作为唯一参考书,该书在这页最后提供免费下载链接(在中心简介视频的第1分钟处见说有讲席教授1人是邓小铁主任在左上角、有访问讲席教授4人其中3人是计算机诺贝尔奖得主在右上角,高文主任在右下角说明已担任与北京大学正校长同是副部长级的国家自然科学基金委员会副主任管十个院的高文根本就不看这么重要的视频-也就只有邓小铁靠他导师的关系才能要来这3个诺贝尔奖得主并1分钟58秒处对具体的研究内容最先说“重点研究面向大数据的数据摘要…”---关于这个哈密顿图专家邓小铁主任-他1982年本科毕业于清华大学其后在中科院读研究生再后去美国跟主撰世界名著《组合最优化》的作者读博士并专业就如这书前言说“前七章重点放在图论与网络流”-在美国数学评论见第一篇论文是朱永津李皓合作的1989年的哈密顿图论文并等1989年也获斯坦福博士、第2篇是1990年论文的第5个文献是应用于图论问题、1991年有哈密顿图论文以及和他美国导师合作的图论论文等。上面John Hopcroft开设的这书共11章加附录并第3章 “随机游走”主要属于是图论、第6章是“海量数据”、第8章“随机图论”、第10章“非负矩阵分解、图论模型”,因此这书可作为大数据的基础,这书作者是按字母顺序排列为:Avrim Blum,John Hopcroft和 Ravindran Kannan,作者之一John Hopcroft就是这中心访问讲席教授也是1986年图灵奖得主,作者之一Ravindran Kannan就是他的导师和师爷就是合写海南琼州大学曾在许多分支居世界领先的图论领域的这篇高被引图论论文“Vertex
packings: Structural properties and algorithms”的师徒George L.
Nemhauser和Leslie
E. Trotter, Jr.,并George L. Nemhauser也是主撰这里倒数第2段的763页名著《Integer and Combinatorial Optimization整数与组合最优化》是我们海南琼州大学在里面攻读三年多的中国第一个组合数学研究室的重要领域的名著。