为鸡娃家长设计的习题生成网页应用

摘要:

面向需要快速提炼知识,在需要通过集中刷题达到快速记忆和检验学习成果的人群,通过大模型对书本知识进行提炼和生成习题为主要功能的网页应用,使得学习新知识更加高效快捷。

真实场景与需求

  • 目标人群:需要通过集中刷题达到快速记忆和检验学习成果的人群

  • 痛点描述:

    • 看完一本书需要大量时间

    • 不知道书中的重点在哪里

    • 不便于随时检验学习成果

    • 复习没有针对性

  • 现有做法:通过大量时间看书学习,购买习题,习题做了无法针对错题进行集中训练

③作品介绍:

通过输入书本内容,经过OCR识别和大模型筛选,提取概念型和示例(佐证)型的知识要点,自动生成习题便于快速刷题,兼具针对错题库专项练习的网页工具

用 SOLO 实现的过程:

我和SOLO先进行沟通,了解清楚写这样的应用都需要我提供怎样的输入。它帮我整理了提示词,我在这个提示词的框架下,将“核心功能”“转化步骤”“输入及输出要求”“界面UI要求”“如何部署”进行结构性梳理,生成较为全面的提示词

  • 用了 SOLO 可以在开始前拆解任务的能力,提出我初步的要求,并让它帮我思考如何结构性的拆解这个网页应用的各个部分

  • 关键 Prompt /

我现在需要生成一个将知识文档(可能是书本照片、PDF文档、扫描文件、整段文字等)提取出其中的原理性知识点,并将知识点转化成学生习题的功能。

核心功能

-生成一个服务型网页,在用户输入内容后对其中的知识要点进行整理和提取,最终输出适合的多种题型的习题。

-该习题可以在线做题,或者排版为适应A4纸打印的文档。

转化步骤

1.将图片、PDF文档、扫描文件、整段文字中的文字提取并通过其中的页码、前后文关系,将其整理成完整的全文,并结构性生成一个完整文档;

2.有目录的,按照目录结构及每个章节的内容,提取其中的知识点,将其中的一类知识点:(概念、原理性的字段)和二类知识点:(对应例举、例证类、周边故事类)的分别提取,二类知识点要与一类知识点有对应关系;

3.将提取的知识点随机转化为练习题,包含:单选题、多选题、判断题;

4.根据用户选项体现到网页相应位置

输入内容

  • 文档下“book”文件夹中的图片

输出结果要求

  • 生成可以在网页浏览器在线中练习的习题集

  • 生成可供下载的书本全文(结构性文本格式)doc或PDF文件

  • 生成排版后的题目,适应A4打印的文档

网页界面要求

  • 全部界面要求全部中文,简约、整洁,米色和浅绿的护眼色组成,利于用户专注习题。可以切换明暗两种模式,尽量采取纯静态网页;

  • 主界面:

    • 包含输入区:“文本输入框或上传文件”;

    • 输出区:“完整文档下载”“生成习题下载”“生成内容预览框”,生成内容可以由用户选择具体章节和字体大小,方便排版打印

  • 做题界面独立于主界面:

    • 左侧边为设置框,点击可收起,可选择章节、题型、错题库等,可以直接开始做题,题型可选择顺序做和随机抽取模式。也可以选择先复习该章节相关一类知识点后再开始做题。

    • 右侧为做题区域和仪表区域

    • 做题区:可选择上一题和下一题,一次只显示一个题目,用户选择答题后,显示正确与否和正确答案,并显示该题所对应的一类知识点。做错的题进入错题库。

    • 仪表区:显示用时、总题数、完成题数、错题数、正确率

    • 错题库:错题库在做题时随时可进入,通过点击"复习错题"后,即可针对错题库进行训练,错题库做题界面和做题去一致。

生成和部署

  • 在项目全部生成后生成告诉我如何在云服务器宝塔面板中进行部署,详细说明部署的具体步骤;我已生成网站名: https://studymachine.ivanov.com.cn

  • 生成项目前如需我确认的信息请先向我询问后再开始执行。

  • 开始前告诉我转化步骤第一步是否需要使用到调用大模型API的功能,如过需要请告诉我提供哪些信息。

中间踩过的坑

  • 为了节省token,经过比选,采用了较为“便宜”的OCR方案,大模型只用来进行知识提取和习题生成。

  • 第一次成果输出

  • 第一实验功能,出现提取失败,于是找SOLO进行debug

  • 但是在部署完成后,输入书页图片后,识别过程很长。

于是推导出了是因为图片像素太大导致的

于是我根据输入图片大小针对性的修改了一下功能。

⑤成果展示:

学习机器已经部署到云端(需要输入自己的大模型API key才能正常使用,推荐使用deepseek-V4 pro)

验证方式与下一步(加分项)

  • 我已经将自考的医疗顾问学习内容输入到系统,并通过协同进行快速反复的题库刷题,在一周的学习期内达到了满意的成果,我先叉会儿腰!

  • 作为海淀的家长,也把即将要学习物理化学内容,通过提取知识点和做习题的形式,提供给孩子使用

下一步改进方向:

  • 进一步加快OCR识别速度
  • 增加判断对错或者生成应用题的功能,以便适配数学或其他学科的学习

头回参加,请大家喜欢的话给我投投票呀

1 个赞

看不到你的图片