llm_eval_simulation

Research codebase for simulation-oriented study of multi-model LLM evaluation workflows in Library and Information Science (LIS).

Status

This repository supports ongoing academic work. Public materials are intentionally concise during submission and review cycles.

Quick Start

pip install -r requirements.txt
python main.py

Optional robustness run:

python main.py --monte-carlo

Additional Commands

python -m src.small_scale_experiment
python -m src.icc_comparison_experiment
python -c "from src.alternative_methods import run_alternative_methods_report; run_alternative_methods_report()"
python scripts/generate_manuscript_docx.py

Outputs

Run artifacts are generated under results/ and are not tracked in git.

Reproducibility Note

Implementation and documentation may be updated alongside peer-review revisions.

License

MIT License. See LICENSE.

Community

Contribution, conduct, security, and template files are included for public collaboration.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.github		.github
docs		docs
scripts		scripts
src		src
tests		tests
.editorconfig		.editorconfig
.gitattributes		.gitattributes
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
ReadMe.md		ReadMe.md
SECURITY.md		SECURITY.md
main.py		main.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

llm_eval_simulation

Status

Quick Start

Additional Commands

Outputs

Reproducibility Note

License

Community

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

llm_eval_simulation

Status

Quick Start

Additional Commands

Outputs

Reproducibility Note

License

Community

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages