DeepSeek深度开发一些经验总结:
背景:
DeepSeek已经开源一段时间,但是基本围绕文本智能交互,影像处理等,而且大多数还是基于python进行的各种尝试....
但是,真要将其应用到我们自己开发的软件中,却又是各种问题,比如
1.如何解析?
2.如何提问能让其正确理解?
3.如何交互完成function calling等过程?
4.如何组合不同的模型能力融为一天进行综合能力的提升...等等.很多..
(吐槽:说起来人人都能吹上天,一旦想要落地取解决一些实际问题,就会遇到各种各样的问题..包括某抖,某红的视频.基本都是教小白,教开发人员的内容...基本找不到几个有价值的..很多时候还容易把工程人员带偏..)
效果图:
下面这个是我对以前写过的一款爆破设计软件(涉及到二维CAD以及三维点云,网格等). 然后近期对其做了升级后,做的融合尝试;
里面的断面以及各种图元,我都是基于 对话 形式,让软件自己判别自动生成的.
做了哪些工作呢?
1 写了类似gpt交互框.
2.ollama框架是开源的,我基于这个做的,对各种大模型进行的加载选择
3.然后对原本旧有项目升级到.net6.0之上,进行交互设计.
想要做到上面,需要用到的技术栈或者准备哪些东西:
1.ollama框架;
2.c# 8.0之上.基于WPF
3.去motai.com或者Hugging Face下载deepSeek-R1-8B+ollama3.2模型(其他的模型根据自己电脑配置进行选择)
以上就是我的一点深入开发的一些探索.
