Finisky Garden

这么个玩意儿也能赚钱？

发表于 2022-10-20 分类于 Product 评论：阅读次数：

一个看着非常简单的App：手机敲木鱼，居然能在App Store上评分4.8，十几万的评论，还有App内购买赚钱，刷新认知不？

这年头多少人绞尽脑汁做App都无人理睬，反倒被这么个极简的玩意儿割了韭菜，原因还是它抓住了用户的痛点。

阅读全文 »

WeLM: A Well-Read Pre-trained Language Model for Chinese 简读

发表于 2022-10-17 分类于 Machine Learning 评论：阅读次数：

微信最近有篇新闻刷屏： # 微信推出自研NLP大规模语言模型WeLM：零/少样本即可完成多种NLP任务

来看看这背后的技术原理又是什么：

WeLM: A Well-Read Pre-trained Language Model for Chinese

阅读全文 »

LaMDA: Language Models for Dialog Applications 简读

发表于 2022-10-14 分类于 Machine Learning 评论：阅读次数：

Google今年发布的聊天机器人LaMDA确实惊艳，之前一个Google员工与它对话后，声称它已经有了自我意识，还上了热搜。今天就来看看这机器人背后的原理是什么。

关键词： 大模型，高质量人工标注数据。

LaMDA: Language Models for Dialog Applications

论文的标题很大，有50多个作者，挺有意思。

阅读全文 »

Towards Boosting the Open-Domain Chatbot with Human Feedback 简读

发表于 2022-10-10 分类于 Machine Learning 评论：阅读次数：

百度最近放出来的一篇文章，发布了一个高质量中文多轮chitchat数据集Diamonte：

Towards Boosting the Open-Domain Chatbot with Human Feedback

Diamonte数据集下载地址

阅读全文 »

Leveraging Similar Users for Personalized Language Modeling with Limited Data 简读

发表于 2022-10-08 分类于 Machine Learning 评论：阅读次数：

今天来看看这篇 ACL2022 的文章：

[ACL2022] Leveraging Similar Users for Personalized Language Modeling with Limited Data

解决的问题很容易理解，个性化语言模型在用户刚加入时缺少数据的冷启动问题：

Personalized language models are designed and trained to capture language patterns specific to individual users.

However, when a new user joins a platform and not enough text is available, it is harder to build effective personalized language models.

思路也比较直接，使用新用户的少量数据在已有用户中找到相似的用户，然后用相似用户的数据进行语言模型的训练，从而解决数据稀疏的问题。

实验论文，提出了三种不同的指标来进行用户相似度计算，实验证明 user embedding + interpolate model效果最好。

阅读全文 »

开卷有益？

发表于 2022-09-24 更新于 2022-10-08 分类于 Thoughts 评论：阅读次数：

开卷有益是一个成语，最早出自《与子俨等疏》。意思是读书总有益处。常用以勉励人们勤奋好学，多读书就会受益。

现在这年头，出书不要太容易，烂书也是出奇的多，开卷有益这词儿已经不适用了。就随口说说我最近翻过的几本烂书：《断舍离》，《组织的力量》，《底层逻辑》。

阅读全文 »

Long-Term Open-Domain Conversation 简读

发表于 2022-09-22 分类于 Machine Learning 评论：阅读次数：

今天来看看这篇 ACL2022 的文章：

[ACL2022] Beyond Goldfish Memory: Long-Term Open-Domain Conversation

问题比较清楚，提升长期开放域对话的效果。题目用到一个梗：超越金鱼的7秒记忆，可以看出论文要解决的问题是跨越数小时甚至数天的会话。

注意： 这里是“长期” (long-term) 对话，不是 “长程”对话，即对话时间跨度比较长的对话。

本文同时发布了一个人与人进行长期对话的数据集 Multi-Session Chat (MSC)，其中双方通过之前的会话互相了解对方的喜好，并在之后的对话中得以体现。

在长期对话中，使用retrieval-augmented的方式，结合对上下文对话的摘要，可以达到超越传统encoder-decoder架构的模型效果。

阅读全文 »

羊了个羊为什么这么火？

发表于 2022-09-18 分类于 Product 评论：阅读次数：

继跳一跳，2048，合成大西瓜等一众休闲小游戏爆火之后，羊了个羊最近频繁上热搜，甚至成了一个梗，它为什么爆红？有什么过人之处？今天就来扒一扒。

阅读全文 »

Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering 简读

发表于 2022-09-13 分类于 Machine Learning 评论：阅读次数：

开放域问答常常需要借助外部知识生成更有信息量和准确的答复。当检索出相关知识后，如何将它们融入生成模型就是个问题。Fusion-in-Decoder (FiD) 这篇文章提出了一个简单有效的方案。

[EACL2021] [FiD] Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering

阅读全文 »

'pandoc exited with code null' 解决方案

发表于 2022-09-12 更新于 2022-09-11 分类于 Hexo 评论：阅读次数：

随着博客文章的不断增加，Hexo生成这些文章需要的时间越来越长，最近居然能卡住几分钟，然后报错：

[ERROR][hexo-renderer-pandoc] pandoc exited with code null. at Object._prettifyError (/home/finisky/node_modules/nunjucks/src/lib.js:36:11)

花了不少时间研究到底问题在哪，最终发现是VM的配置太低所致…… :-(

阅读全文 »

0%