Use prompt template from HF tokenizer

Currently we hard code prompt templates in ExecuTorch LLM apps.

But HF tokenizers know how to apply the chat template, e.g.,

```
prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # Switches between thinking and non-thinking modes. Default is True.
)
```

This makes using HF models from python with the right template very easy. 

Can we have similar logic in our C++ runners?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Use prompt template from HF tokenizer #131

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Use prompt template from HF tokenizer #131

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions