我做了5年FPGA通信基带开发,但芯片行业现在流行存算一体架构,感觉技术栈落后了。请问如何转型到存算一体领域?需要掌握哪些新工具(如PyTorch、ONNX)和协议(如UCIe、CXL)?有没有成功的转型案例?
2026年,芯片行业“存算一体”架构火热,传统FPGA工程师如何转型,需要学习哪些新工具和协议?
提问
回答 4

做了5年FPGA通信基带,底子很扎实,硬件思维是你的优势。存算一体虽然听起来新,但本质是把计算和存储物理上拉近,减少数据搬运。你已有的RTL设计、时序分析、片上互联经验,尤其是PCIe或AXI总线经验,直接能迁移到UCIe和CXL这类协议上。
工具方面,PyTorch和ONNX是绕不开的。你不需要成为算法专家,但要能看懂模型结构、知道算子对应什么硬件模块。建议先拿个简单模型(比如MobileNet)跑通ONNX导出,再手动分析它的计算图,拆成你熟悉的流水线。工具链上,Xilinx Vitis AI、Intel OpenVINO都有存算一体加速器的参考设计,跟着走一遍就能上手。
协议方面,UCIe(小芯片互联)和CXL(缓存一致性)是当前热点。UCIe物理层基于SerDes,和你调的GTH/GTY收发器原理类似,重点学它的适配层和协议层。CXL更偏内存语义,可以看IBM的CXL白皮书,再搭个QEMU模拟环境验证。
成功案例:我认识一位做LTE基带的工程师,去年转去一家存算一体初创,他花了半年把公司内部NPU的指令集摸透,然后自己写了个CNN加速器的小模块挂在UCIe总线上,很快就融入团队。关键是别怕从零开始,存算一体生态还很新,你的FPGA调试经验反而是稀缺的。

兄弟,5年基带经验别觉得自己落后,FPGA的并行计算和低延迟控制能力,恰好是存算一体芯片里最缺的。那些纯软件背景的人写RTL经常时序不收敛,你上手快得多。
转型第一步:把PyTorch的模型量化搞明白。存算一体芯片大多用INT8甚至更低精度,你拿PyTorch里torch.quantization练手,再配合ONNX导出成计算图。重点不是训练,是看懂网络怎么拆成矩阵乘、卷积这些算子,然后对应到你的FPGA加速器设计里。
第二步:UCIe协议必须学,它和PCIe类似但更轻量。去github找lowRISC的UCIe开源实现,自己搭个Verilator仿真环境跑通。CXL暂时不急,多数存算一体芯片当前还是用UCIe做die-to-die互联。
工具上别贪多:Xilinx Vitis HLS可以帮你把C++算法转成RTL,但存算一体更强调存内计算单元,建议看看SambaNova和Groq的公开专利,理解他们怎么用数据流架构。
转型案例:我们团队有个同事,之前做FPGA高速接口,转到存算一体后专门负责UCIe PHY的验证。他把以前调GTH的经验全用上,联调时一次过,现在已经是核心骨干。你只要肯啃协议spec和开个仿真环境,三个月就能入门。

存算一体架构说白了就是让存储单元也能做计算,和FPGA的LUT、BRAM被重新配置的思路很像。你根本不需要从零学,把FPGA里分布式RAM、寄存器堆的用法放大到芯片级别就是那一套。
需要学的工具:PyTorch必须会用,不用精通,但要能跑通torch.onnx.export,拿到onnx文件后,用Netron可视化看看算子分布。然后去读Mythic、Syntiant这些公司的白皮书,他们讲存算一体芯片的架构和指令集,比看书快。
协议上,UCIe是硬菜,它定义了物理层、适配层和协议层,你只要重点掌握适配层的flit格式和CRC校验,这部分和你FPGA里调试Aurora协议类似。CXL可以放第二位,等公司项目真用到再啃。
成功路径:我认识一个做FPGA视频处理的,转型存算一体后专门做计算单元的微架构。他把以前用Verilog写的卷积加速器代码,改成存内计算的MAC单元,再挂到UCIe总线上。工具链用了Xilinx的Vivado和Synopsys的DC,反正你都会。
提醒一句:别被PyTorch吓住,你不需要懂反向传播。能看懂模型推理时的数据流,知道哪些层适合存内计算就够了。实在不行去B站搜“存算一体入门”,有好多FPGA工程师转行的分享视频,看完就有底了。

做了五年通信基带,底子很好,转型存算一体是有路径的。你现在的需求痛点应该是:存算一体听起来像是纯算法或者架构师的事,FPGA工程师的硬件思维还能不能派上用场?答案是,不仅能,而且很关键。存算一体的核心是把计算挪到存储附近,减少数据搬运,而FPGA恰恰擅长做这种定制化的数据流控制和接口对接。你需要补的主要是新接口协议和上层工具链,比如UCIe和CXL这两个必学,它们是连接计算单元和存储单元的标准化高速互联协议。工具方面,不用被PyTorch和ONNX吓到,你不是去训练模型的,而是要学会看懂模型导出的计算图,知道哪些算子能映射到硬件上。具体步骤:先花两周把UCIe协议栈的物理层和链路层过一遍,重点看FPGA的硬核怎么配置。然后装个Vitis AI或者类似工具链,跑一个简单的ONNX模型到FPGA上的部署流程,感受一下从算法到硬件的转换。这样就能把你原来的基带开发经验平滑过渡到存算一体的数据流控制上。成功案例很多,比如一些做边缘AI加速的团队,原来就是做无线通信FPGA的,转型后负责把神经网络层映射到SRAM或ReRAM阵列的控制器里,基本逻辑和你以前做基带调制解调是一样的,只是数据源从通信信号变成了张量。
发表回答
登录后可在本页底部提交回答
