大模型创业前必须想清楚的问题

在开始大模型创业之前,首先应该想清楚下面五个问题,否则人无远虑,必有近忧。 自ChatGPT面世以来,有两种趋势主导着初创公司和初创投资的世界,可惜这两种趋势都是错误的。首先,有一大批初创公司计划使用大模型(ChatGPT或GPT4)为已知问题提供更好的解决方案。这就像说他们正在拿一些预先烘焙的蛋糕之一,再在上面加点糖,就能使其更美味。其次,这些初创公司正在烘烤大量这些蛋糕,投资者已经开始关注糖本身的差异化——他们现在强调位于大模型之上的技术层的深度。最近一些成功融资的案例大多在宣扬糖本身拥有不同颜色、口味或质地。 ...

Posted on 2023-12-21 ·  In NLP ·  5 min read

Phi-2: 小型语言模型的惊人威力

微软发布了Phi-2,这是一个拥有27亿参数的语言模型,展示了出色的推理和语言理解能力,在小于130亿参数的基础语言模型中表现出最先进的性能。在复杂的基准测试中,由于模型扩展和训练数据精选方面的创新,Phi-2能够匹敌或超越大约25倍更大的模型。 ...

Posted on 2023-12-14 ·  In NLP ·  4 min read

Textbooks Are All You Need 精要

微软最近提出了一个有趣的方法,即使用合成教科书来教授模型,而不是通常使用的大规模数据集。 论文原文:https://arxiv.org/abs/2306.11644 这篇论文介绍了一个名为Phi-1的模型,它完全是在一本定制的教科书上进行训练的。研究人员发现,对于某些任务,这种方法和使用大量数据进行训练的规模更大的模型一样有效。 ...

Posted on 2023-12-13 ·  In NLP ·  2 min read

“屎山代码”:开发中的陷阱与教训

在软件开发领域,有一个广受开发者共鸣的词汇——“屎山代码”(Spaghetti Code),这个术语形象地描述了一种混乱、难以理解和难以维护的代码结构。本文将深入解析什么是“屎山代码”以及它为何成为软件开发中的一大陷阱。 ...

Posted on 2023-12-11 ·  In Coding ·  2 min read

《历史的教训》精要

《The Lessons of History》是由威尔·杜兰特(Will Durant)和阿里尔·杜兰特(Ariel Durant)夫妇合作编写的一本书,它于1968年首次出版。这本书是一部关于历史哲学的作品,从历史的角度探讨了人类社会的发展和演变,并试图从历史中汲取宝贵的教训。 ...

Posted on 2023-12-11 ·  In Insights ·  15 min read

让 Outlook 链接在 Chrome 中打开

在 Outlook 里点链接,明明 Chrome 是默认浏览器,却偏偏用 Edge 打开。在"默认应用"里确认过 Chrome 是默认浏览器也没用。解决方法如下: ...

Posted on 2023-12-07 ·  In Misc ·  1 min read

ChatGPT写的北大口腔挂号程序

北大口腔挂号有多难大家都很清楚,今天就让ChatGPT写一个挂号程序,可惜挂号部分写得太潦草,跟没写一样: import datetime class PekingUniversityStomatologyHospital: def __init__(self): self.departments = ["口腔科", "牙周病科", "口腔颌面外科"] self.doctors = { "口腔科": ["张医生", "王医生"], "牙周病科": ["李医生", "赵医生"], "口腔颌面外科": ["陈医生", "刘医生"] } self.appointment_records = [] def get_departments(self): return self.departments def get_doctors(self, department): return self.doctors.get(department, []) def make_appointment(self, department, doctor, date, time): appointment_info = { "Department": department, "Doctor": doctor, "DateTime": datetime.datetime.strptime(f"{date} {time}", "%Y-%m-%d %H:%M"), "Status": "Scheduled" # 预约状态,可根据实际情况添加更多状态 } self.appointment_records.append(appointment_info) return appointment_info # 使用示例 hospital = PekingUniversityStomatologyHospital() # 获取科室列表 departments_list = hospital.get_departments() print("科室列表:", departments_list) # 获取口腔科医生列表 dentistry_doctors_list = hospital.get_doctors("口腔科") print("口腔科医生列表:", dentistry_doctors_list) # 挂号 appointment_info = hospital.make_appointment("口腔科", "张医生", "2023-01-01", "09:00") print("挂号成功:", appointment_info) # 查看挂号记录 print("挂号记录:", hospital.appointment_records)

Posted on 2023-12-06 ·  In Misc ·  2 min read

检索增强生成(RAG)简介

检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种新的自然语言处理(NLP)方法,它将预训练的参数化和非参数化记忆相结合,旨在提高知识密集型NLP任务的性能。本文将探讨RAG框架及其在NLP领域的潜在应用。 ...

Posted on 2023-12-06 ·  In NLP ·  3 min read

每个人都有自己的时区

纽约时间比加州时间早三个小时, New York is 3 hours ahead of California, 但加州时间并没有变慢。 but it does not make California slow. 有人22岁就毕业了, Someone graduated at the age of 22, 但等了五年才找到好的工作! but waited 5 years before securing a good job! ...

Posted on 2023-12-05 ·  In Insights ·  1 min read

WordPress 固定链接 404 问题解决

问题现象: WordPress 固定链接结构只能用"朴素"模式,改成其他格式文章就 404。 更新文章时报错:“更新失败。响应不是有效的 JSON 响应。” ...

Posted on 2023-12-05 ·  In WordPress ·  1 min read