- 永远不要再把sigmoid写错成softmax
- cnn层最后加三个fc层比加1个效果要好得多
- 如果参数太多,可以在最后一个cnn层后面加一个maxpooling整个图
- 要记得指定data_format=“channel_first",此时batch_norm层要指定axis=1
- 20w参数的模型在GTX1050上用 tf2 勉强能跑的
- tf2 性能比 pytorch好太多了,首先在显存和内存的管理上就比pytorch好不知几个档次
- 在sequential中不要用''' '''来注释
- 不要跑60个epoch就浅尝辄止,至少跑到test acc经过50个epoch没有0.1%的提升为止