什么是 Diffusion LLM,为什么它很重要?
快速阅读: 《黑客 Noon》消息,今日,创世纪实验室发布了首款商用扩散大型语言模型(dLLM)——水星编码器,引起学术界和人工智能行业的广泛关注。与自回归型LLM不同,水星编码器的工作原理类似AI图像生成器。例如,当请求将其图像分割成两半时,它返回了一个Python代码片段以实现该功能。
今日,创世纪实验室发布了首款商用扩散大型语言模型(dLLM)——水星编码器,此举在学术界和人工智能行业引起了巨大轰动。与自回归型LLM(如今所有你熟知的LLM)不同,扩散LLM的工作原理类似于你最喜欢的AI图像生成器,如稳定扩散,最终结果从一堆无意义的文本中显现。以下是一个示例,展示了请求水星编码器编写Python程序来将图像分割成两半的过程:
“请编写一个Python程序,将图像分割成两半。”
水星编码器回复:““`python
def split_image(image_path):
from PIL import Image
image = Image.open(image_path)
width, height = image.size
half_width = width // 2
left_half = image.crop((0, 0, half_width, height))
right_half = image.crop((half_width, 0, width, height))
return left_half, right_half
“`”
(以上内容均由Ai生成)