读 -> 处理 ->写入一般来说读的速度是快过算法核的 ,或者读出的位数大于处理的位数(单周期读出128位,运算为32位),这样就给了FPGA并行处理的可能性
做个数据缓存!就是我们通常说的fifo。
输入是什么量?输出呢》