自然语言模型自然语言处理N天-AllenNLP学习（使用Lazy Data训练模型）

找项目网 2023-05-21 00:09 找项目网 | 隐藏边栏 0

导语：我又回来了，Pytorch的学习也是为了熟悉AllenNLP结构，所以，在完成基础tutorial之后又折回来继续学AllenNLP。Data是相对于实例数据而言，实例数据有时会太大，有时用户只是想每次迭代中使用样例，优势是想立即训练，或是其他原因，这里就可以使用懒数据。这个教程是用来告诉你，它们（使用懒数据训练模型）都包括了什么。注意，这里的代码片段是不能直接运行的，仅仅作为解释注意，这里的代码片段是不能直接运行的，仅仅作为解释注意，这里的代码片段是不能直接运行的，仅仅作为解释

多元线性回归模型r语言_自然语言处理用什么语言_自然语言模型

新建 Microsoft PowerPoint 演示文稿 (2).jpg

我又回来了，Pytorch的学习也是为了熟悉AllenNLP结构，所以，在完成基础tutorial之后又折回来继续学AllenNLP。四月份的目标是复现那篇论文中的结构并使用Finetuning完成Transformer。

今天开始AllenNLP入门的第二部分How-to。总共包括七个小节。

2. 使用Lazy Data训练模型

这里的Lazy Data是相对于实例数据而言，实例数据有时会太大，有时用户只是想每次迭代中使用样例，优势是想立即训练，或是其他原因，这里就可以使用懒数据。

这个教程是用来告诉你，它们（使用懒数据训练模型）都包括了什么。如果需要更加具体的内容，需要看这个Laziness in AllenNLP。我在最后会把这个教程重新拿出来拆分一下看看。

1.1 在 YourDatasetReader 构造函数

YourDatasetReader子类的构造函数中有lazy参数和from_params方法。然后通过数值传入superclass constructor

注意，这里的代码片段是不能直接运行的，仅仅作为解释

def __init__(self,
 tokenizer: Tokenizer = None,
 token_indexers: Dict[str, TokenIndexer] = None,
 lazy: bool = False) -> None:
 super().__init__(lazy)

1.2 在 YourDatasetReader._read()

YourDatasetReader._read()返回的应该是一个generator类型自然语言模型，而不是list

注意自然语言模型，这里的代码片段是不能直接运行的，仅仅作为解释

def _read(self, file_path: str) -> Iterable[Instance]:
 # logic to iterate over file
 # some kind of for loop
 # instance = ...
 yield instance

1.3 在dataset_reader一节中，用户实验配置

用户应该在实验配置的dataset_reader部分中指定'lazy'：true。

注意，这里的代码片段是不能直接运行的，仅仅作为解释

 "dataset_reader": {
 "type": "snli",
 "lazy": true,
 "token_indexers": {
 "tokens": {
 "type": "single_id",
 "lowercase_tokens": true
 }
 }
 },

1.4 在iterator 一节中的实验配置

用户应该在实验配置的迭代器部分中尽可能大地指定“max_instances_in_memory”。（您不必这样做，但这是一个好主意，特别是如果您想使用BucketIterator。）

 def __init__(self,
 batch_size: int = 32,
 instances_per_epoch: int = None,
 max_instances_in_memory: int = None) -> None:
 self._batch_size = batch_size
 self._instances_per_epoch = instances_per_epoch
 self._max_instances_in_memory = max_instances_in_memory

Laziness这部分没有找到源码，在想是不是要自己撸一遍看看。

———END———
限时特惠：本站每日持续更新海量各大内部创业教程，一年会员只需128元，全站资源免费下载点击查看详情
站长微信：jiumai99

自然语言自然语言处理

1.站长不是项目作者，不对项目解答及盈亏负责。
2.本站所有项目来源于投稿或购买自其他第三方，若本站侵犯了您的权益请联系站长进行删除处理。

找项目网关注：0 粉丝：0

这个人很懒，什么都没写

你可能也喜欢

热评文章

找好项目-就到找项目网

聚合阅读

标签云(过期项目)

自然语言模型 自然语言处理N天-AllenNLP学习（使用Lazy Data训练模型）