当前位置: 首页 > news >正文

搭建本地支持联网推理助手(附源码)

20251212_搭建本地支持联网推理助手

一、问题

搭建本地助手,提升工作效率。

二、代码

importjsonimportosimportwarningsimportgradioasgrimportrequests AUTHORIZATION="Bearer XXXXXXXXXXX"PROXIES={'https':'http://XXXXXXXXXXX8080',# 替换为自己的域账号和密码'http':'http://XXXXXXXom:8080',}os.environ["no_proxy"]="localhost,127.0.0.1,::1"os.environ['GRADIO_ANALYTICS_ENABLED']='False'warnings.filterwarnings("ignore",category=requests.packages.urllib3.exceptions.InsecureRequestWarning)defstream_response_v3(question,history):messages=[]fornum,hisinenumerate(history):ifnum>=3:breakmessages.append({"role":"user","content":history[0]['content']})messages.append({"role":"assistant","content":history[1]['content']})passmessages.append({"role":"user","content":question})data={"model":"ep-20250718205753-s4hns","messages":messages,"stream":True}try:response=requests.post("https://ark.cn-beijing.volces.com/api/v3/chat/completions",headers={"Authorization":AUTHORIZATION,"Content-Type":"application/json"},proxies=PROXIES,verify=False,json=data,stream=True,timeout=30)response.raise_for_status()full_response=""forlineinresponse.iter_lines():ifline:decoded_line=line.decode('utf-8').lstrip('data: ').strip()ifdecoded_line=="[DONE]":breaktry:chunk=json.loads(decoded_line)ifchunk.get('choices'):delta=chunk['choices'][0].get('delta',{})ifdelta.get('content'):content=delta['content']full_response+=contentyieldfull_responseexceptjson.JSONDecodeError:continueexceptrequests.exceptions.RequestExceptionase:yieldf"请求发生错误:{str(e)}"exceptExceptionase:yieldf"处理响应时发生错误:{str(e)}"defchat_with_ark(message,history):""" 支持多轮对话的ARK聊天函数 Args: message: 用户当前输入的消息 history: 对话历史记录,格式为: [{'role': 'user/assistant', 'content': '消息内容'}, ...] Yields: 逐步生成的回复内容 """messages=[]forturninhistory:messages.append({"role":turn["role"],"content":[{"type":"input_text","text":turn["content"]}]})messages.append({"role":"user","content":[{"type":"input_text","text":message}]})payload={"model":"ep-20251210140512-99ld2","stream":True,"tools":[{"type":"web_search","max_keyword":3}],"input":messages# 使用包含历史的消息列表}response=requests.post("https://ark.cn-beijing.volces.com/api/v3/responses",headers={"Authorization":AUTHORIZATION,"Content-Type":"application/json"},json=payload,stream=True,verify=False,proxies=PROXIES)partial_response=""forlineinresponse.iter_lines():ifline:decoded_line=line.decode('utf-8')ifdecoded_line.startswith('data:'):try:data=json.loads(decoded_line[5:])ifdata.get("type")=="response.output_text.delta":delta=data.get("delta","")partial_response+=deltayieldpartial_responseexceptjson.JSONDecodeError:continuewithgr.Blocks()asdemo:withgr.Tabs():withgr.Tab("1. deepseek-v3-671b"):chatbot1=gr.Chatbot(height=580,type="messages")chat_interface1=gr.ChatInterface(fn=stream_response_v3,cache_examples=False,chatbot=chatbot1,fill_height=True)chat_interface1.scale=2examples1=gr.Examples(examples=["请帮我写python代码,功能要求如下:","请帮我修改python代码,功能要求如下:","下述错误是什么原因?怎么解决?","我的代码报如上,我的代码报错如下。错误原因是什么?怎么解决?",],inputs=chat_interface1.textbox,run_on_click=False,cache_examples=False,)withgr.Tab("2. deepseek-v3-671b(web search)"):chatbot2=gr.Chatbot(height=580,type="messages")chat_interface2=gr.ChatInterface(fn=chat_with_ark,cache_examples=False,chatbot=chatbot2,fill_height=True)chat_interface2.scale=2examples2=gr.Examples(examples=["请帮我写python代码,功能要求如下:","请帮我修改python代码,功能要求如下:","下述错误是什么原因?怎么解决?","我的代码报如上,我的代码报错如下。错误原因是什么?怎么解决?",],inputs=chat_interface2.textbox,run_on_click=False,cache_examples=False,)port=30005importpsutilforprocinpsutil.process_iter(['pid','name']):try:forconninproc.connections():ifconn.laddr.port==port:print(f"Killing process{proc.pid}({proc.name()})")proc.kill()breakexceptExceptionase:print(e)passdemo.queue().launch(server_name="127.0.0.1",server_port=port,share=False,show_error=True)
http://www.jsqmd.com/news/76805/

相关文章:

  • 2025最新出炉!热镀锌打包带优质厂家排行榜,镀锌打包扣/冷镀锌打包带/镀锌打包带/铜棒打包带/玻璃打包带/打包铁条热镀锌打包带企业选哪家 - 品牌推荐师
  • 闲置上门回收小程序开发、一键回收超轻松!
  • 用可视化利润计算器,实现你的财务清晰度
  • 毕业设计项目 深度学习手写数字识别系统(源码+论文)
  • 超越简单收益:用“年化ROI计算器”看清投资的真实表现
  • 英伟达发布OpenReasoning-Nemotron-32B:多智能体协作改写推理范式,32B参数刷新三大领域性能纪录
  • Qwen-Image-Lightning:如何用4-8步实现实时文生图创作
  • WebPlotDigitizer:图表数据提取的终极解决方案
  • 2025年中国五大电子汽车衡厂商推荐:汽车衡正规厂商哪家性价 - mypinpai
  • 大模型训练优化:5个内存效率提升技巧与实战配置指南
  • 2025年驱动轮生产厂技术实力排名,国产核心部件商全解析 - myqiye
  • 2025年ELBE联轴器品牌推荐排名,看看哪家价格实惠 - 工业推荐榜
  • 人工智能作业
  • 2025年度五大美式家具专业制造商推荐,美式家具推荐制造商与 - 工业品牌热点
  • BetterDiscord终极配置指南:5步打造个性化聊天体验
  • 精通 oil.nvim 排序配置:打造个性化文件管理体验
  • 66、Linux系统脚本编写、邮件配置、数据库使用及安全设置指南
  • 探索你的“饮食碳足迹”:一款直观的可持续饮食计算工具
  • 自创获利比副图再次优化更美观更实用 源码
  • 破浪扬帆新航道:辽宁沈阳出海企业借力外贸GEO优化重塑全球竞争力 - 博客万
  • 如何做Dify二次开发?
  • Pock快捷键创新操作:重新定义Touch Bar高效使用技巧
  • Spring管理MyBatis Mapper接口的原理详解
  • deepseek技术总结
  • Js中日期处理的问题
  • Trae Agent离线模式终极指南:无网络环境下的完整解决方案
  • 终极指南:用ReplayBook轻松搞定英雄联盟回放管理
  • AI 工程师的破茧之路!告别迷茫,从零到实战的5步进阶攻略
  • 5步快速上手GPT-2 XL:从零开始的AI写作实战指南
  • 梦笔记20251212