
macOSpilot
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
Google Research的一篇研究,介绍了StyleDrop:通过参考图片,使用文本生成图像,风格符合参考图像。效果好于DreamBooth、Imagen和Stable Diffusion的textual inversion方法。
项目地址:https://styledrop.github.io/
论文:https://arxiv.org/abs/2306.00983