我已经在python中创建了一个机器学习算法,它通过一个RESTAPI提供服务,并希望在google cloud/amazon ec2上实现它来进行实时预测。在我这样做之前,我想为进入/退出模型的每个请求/预测创建一个“日志”——这对我来说似乎是一个很好的实践,并且可能有助于创建唯一的预测标识符。只是一个简单的1或0,它存储在一个带有日期时间戳和唯一ID的数据库中。
我应该如何将这些数据发送到数据库而不影响模型的运行时间?在API中插入into语句?一个单独的API?
非常感谢你的帮助!
这取决于结果的延迟。如果您希望它立即在数据库中保存数据,那么当您收到请求时,必须立即创建一个API。由于这些文件本质上是日志文件,所以我建议在本地存储日志,并每天插入一次日志,以减少一段时间内的网络拥塞。如果您现有的API已经连接到DB,那么我认为不需要为一个简单的 post 呼叫
post