NLP | Coriva

大模型创业前必须想清楚的问题

在开始大模型创业之前，首先应该想清楚下面五个问题，否则人无远虑，必有近忧。自ChatGPT面世以来，有两种趋势主导着初创公司和初创投资的世界，可惜这两种趋势都是错误的。首先，有一大批初创公司计划使用大模型（ChatGPT或GPT4）为已知问题提供更好的解决方案。这就像说他们正在拿一些预先烘焙的蛋糕之一，再在上面加点糖，就能使其更美味。其次，这些初创公司正在烘烤大量这些蛋糕，投资者已经开始关注糖本身的差异化——他们现在强调位于大模型之上的技术层的深度。最近一些成功融资的案例大多在宣扬糖本身拥有不同颜色、口味或质地。 ...

Phi-2: 小型语言模型的惊人威力

微软发布了Phi-2，这是一个拥有27亿参数的语言模型，展示了出色的推理和语言理解能力，在小于130亿参数的基础语言模型中表现出最先进的性能。在复杂的基准测试中，由于模型扩展和训练数据精选方面的创新，Phi-2能够匹敌或超越大约25倍更大的模型。 ...

Textbooks Are All You Need 精要

微软最近提出了一个有趣的方法，即使用合成教科书来教授模型，而不是通常使用的大规模数据集。论文原文：https://arxiv.org/abs/2306.11644 这篇论文介绍了一个名为Phi-1的模型，它完全是在一本定制的教科书上进行训练的。研究人员发现，对于某些任务，这种方法和使用大量数据进行训练的规模更大的模型一样有效。 ...

ChatGPT写的北大口腔挂号程序

北大口腔挂号有多难大家都很清楚，今天就让ChatGPT写一个挂号程序，可惜挂号部分写得太潦草，跟没写一样： import datetime class PekingUniversityStomatologyHospital: def __init__(self): self.departments = ["口腔科", "牙周病科", "口腔颌面外科"] self.doctors = { "口腔科": ["张医生", "王医生"], "牙周病科": ["李医生", "赵医生"], "口腔颌面外科": ["陈医生", "刘医生"] } self.appointment_records = [] def get_departments(self): return self.departments def get_doctors(self, department): return self.doctors.get(department, []) def make_appointment(self, department, doctor, date, time): appointment_info = { "Department": department, "Doctor": doctor, "DateTime": datetime.datetime.strptime(f"{date} {time}", "%Y-%m-%d %H:%M"), "Status": "Scheduled" # 预约状态，可根据实际情况添加更多状态 } self.appointment_records.append(appointment_info) return appointment_info # 使用示例 hospital = PekingUniversityStomatologyHospital() # 获取科室列表 departments_list = hospital.get_departments() print("科室列表:", departments_list) # 获取口腔科医生列表 dentistry_doctors_list = hospital.get_doctors("口腔科") print("口腔科医生列表:", dentistry_doctors_list) # 挂号 appointment_info = hospital.make_appointment("口腔科", "张医生", "2023-01-01", "09:00") print("挂号成功:", appointment_info) # 查看挂号记录 print("挂号记录:", hospital.appointment_records)

检索增强生成（RAG）简介

检索增强生成（Retrieval-Augmented Generation，简称RAG）是一种新的自然语言处理（NLP）方法，它将预训练的参数化和非参数化记忆相结合，旨在提高知识密集型NLP任务的性能。本文将探讨RAG框架及其在NLP领域的潜在应用。 ...