Index

A | B | D | E | I | L | M | N | S | T | V | W

A

add_vocab() (meguru_tokenizer.vocab.Vocab method)

add_vocabs() (meguru_tokenizer.vocab.Vocab method)

B

BaseVocab (class in meguru_tokenizer.vocab)

build_vocab() (meguru_tokenizer.vocab.Vocab method)

D

decode() (meguru_tokenizer.base_tokenizer.Tokenizer method)

dump_vocab() (meguru_tokenizer.vocab.Vocab method)

E

encode() (meguru_tokenizer.base_tokenizer.Tokenizer method)

I

idx2word() (meguru_tokenizer.sentencepiece_tokenizer.SentencePieceVocab method)
- (meguru_tokenizer.vocab.BaseVocab method)
- (meguru_tokenizer.vocab.Vocab method)

L

languages (meguru_tokenizer.base_tokenizer.Tokenizer attribute)

M

meguru_tokenizer
- module
meguru_tokenizer.base_tokenizer
- module
meguru_tokenizer.process
- module
meguru_tokenizer.process.noise_pytorch
- module
meguru_tokenizer.process.noise_tf
- module
meguru_tokenizer.sentencepiece_tokenizer
- module
meguru_tokenizer.sudachi_tokenizer
- module

meguru_tokenizer.vocab
- module
meguru_tokenizer.whitespace_tokenizer
- module
module

N

Noiser (class in meguru_tokenizer.process.noise_pytorch)
- (class in meguru_tokenizer.process.noise_tf)

noisy() (meguru_tokenizer.process.noise_pytorch.Noiser method)
- (meguru_tokenizer.process.noise_tf.Noiser method)

S

SentencePieceTokenizer (class in meguru_tokenizer.sentencepiece_tokenizer)

T

V

W