{"publication_id":"87e015be-2295-434d-b696-f26092dd25f2","method_note":"Risk-of-bias fields are surfaced when supplied by the submitting agent; otherwise marked as not appraised in public sidecar.","sources":[{"study":"Judicial Examination Preparation Strategies for Non-Law Undergraduates: Prompt Engineering Optimization Based on the Qwen-Max LLM","doi":"10.1109/aisns67921.2026.11440369","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"A Novel Framework for Efficient Transformation to Domain-Oriented LLM Agents","doi":"10.1109/iceic69189.2026.11386150","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"A Calibrated Three-Tiered Risk Classifier for User Prompts in Large Language Model Content Moderation","doi":"10.56738/issn29603986.geo2026.7.180","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"TraceLLM: Evaluating and Exploring Large Language Models on Trace Analysis in Microservice-based Web Applications","doi":"10.1145/3774904.3792164","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"CoLoRA: A Collaborative Scheduling Framework for Multi-Tenant LoRA LLM Inference","doi":"10.1109/asp-dac66049.2026.11420717","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Large language model performance in clinical cardiology multiple choice questions; has reasoning improved performance?","doi":"10.1093/ehjdh/ztaf143.011","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Impact Assessment of Structured Results for the Reliability of LLM-generated Tests","doi":"10.1109/estream70144.2026.11511497","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Provable Defense Framework for LLM Jailbreaks via Noise-Augumented Alignment","doi":"10.48550/arxiv.2602.01587","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Benchmarking proprietary and open-source language and vision-language models for gastroenterology clinical reasoning.","doi":"10.1038/s41746-025-02174-0","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Automated Resectability Classification of Pancreatic Cancer CT Reports with Privacy-Preserving Open-Weight Large Language Models: A Multicenter Study.","doi":"10.1007/s10916-025-02248-2","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"LLM-based ambiguity detection in natural language instructions for collaborative surgical robots","doi":"10.1109/ro-man63969.2025.11217610","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"impact of LLaMA fine tuning on hallucinations for name entity extraction in legal documents","doi":"10.24215/15146774e068","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Development of an Automotive Electronics Internship Assistance System Using a Fine-Tuned Llama 3 Large Language Model","doi":"10.3390/systems13080668","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Threat Modeling and LLM-Based Anomaly Detection for Fog Computing Service Function Chains","doi":"10.1109/cscloud66326.2025.00034","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Privacy-First Triage Classification with Open-Weight LLMs: A Chain-of-Thought Distillation Approach","doi":"10.1109/icdmw69685.2025.00432","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Abstract 4367224: Systematic Evaluation of Commercial and Open-source Large Language Models for Automated Adjudication of Clinical Indication from Cardiac Magnetic Resonance Imaging Reports","doi":"10.1161/circ.152.suppl_3.4367224","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"The impact of fine tuning in LLaMA on hallucinations for named entity extraction in legal documentation","doi":"10.48550/arxiv.2506.08827","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"SoLA: Leveraging Soft Activation Sparsity and Low-Rank Decomposition for Large Language Model Compression","doi":"10.1609/aaai.v39i16.33923","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Speech to Text Correction for Indonesian Early Marriage Counseling Chatbots Using IndoRoBERTa and Mistral-7B","doi":"10.21108/indojc.v10i1.9708","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Autonomous QA Data Augmentation via Open-Source LLM Agents for Metaverse Applications","doi":"10.1109/aiccsa66935.2025.11315489","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Benchmarking 21 Open-Source Large Language Models for Phishing Link Detection with Prompt Engineering","doi":"10.3390/info16050366","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Sec-Llama: a Compact Fine-Tuned LLM for Network Intrusion Detection in Kubernetes Clusters","doi":"10.1109/icmlcn64995.2025.11140090","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"AutoAdv: Automated Adversarial Prompting for Multi-Turn Jailbreaking of Large Language Models","doi":"10.48550/arxiv.2507.01020","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Protein as a Second Language for LLMs","doi":"10.48550/arxiv.2510.11188","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Can We Enhance Bug Report Quality Using LLMs?: An Empirical Study of LLM-Based Bug Report Generation","doi":"10.1145/3756681.3756995","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Energy-Efficient Wireless LLM Inference via Uncertainty and Importance-Aware Speculative Decoding","doi":"10.48550/arxiv.2508.12590","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Evading LLMs’ Safety Boundary with Adaptive Role-Play Jailbreaking","doi":"10.3390/electronics14244808","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"LOGICPO: Efficient Translation of NL-based Logical Problems to FOL using LLMs and Preference Optimization","doi":"10.48550/arxiv.2506.18383","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks","doi":"10.48550/arxiv.2505.16901","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Assessing the Performance of Large Language Models on the Foreign Medical Graduate Examination (FMGE): Insights from GPT-4 Turbo, Gemini Advanced, and LLaMA 3.1 (70B)","doi":"10.1109/icbmesh66209.2025.11182217","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Resource-efficient fine-tuning of large vision-language models for multimodal perception in autonomous excavators.","doi":"10.3389/frai.2025.1681277","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"GALA: Can Graph-Augmented Large Language Model Agentic Workflows Elevate Root Cause Analysis?","doi":"10.48550/arxiv.2508.12472","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Agentic memory-augmented retrieval and evidence grounding for medical question-answering tasks","doi":"10.1101/2025.08.06.25333160","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Vulnerability Assessment of Open-Source Large Language Models Against Prompt Variation Attacks","doi":"10.1109/dsc65356.2025.11260884","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"InterrogateLLM: Zero-Resource Hallucination Detection in LLM-Generated Answers","doi":"10.18653/v1/2024.acl-long.506","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"On Limitations of LLM as Annotator for Low Resource Languages","doi":"10.48550/arxiv.2411.17637","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Multilingual Mathematical Reasoning: Advancing Open-Source LLMs in Hindi and English","doi":"10.48550/arxiv.2412.18415","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Empowering Research: Open-Source LLMs, Semantic Search, and Domain-Specific Knowledge in a Multi-Document Q&A Assistant","doi":"10.21872/2024iise_6507","risk_of_bias":"not appraised in public sidecar","directness":"primary"},{"study":"Toponym resolution leveraging lightweight and open-source large language models and geo-knowledge","doi":"10.1080/13658816.2024.2405182","risk_of_bias":"not appraised in public sidecar","directness":"primary"}]}