NLPTemplateEngine vignette

This blog post describes and exemplifies the Python package “NLPTemplateEngine”, [AAp1], which aims to create (nearly) executable code for various computational workflows.

Package’s data and implementation make a Natural Language Processing (NLP) Template Engine (TE), [Wk1], that incorporates Question Answering Systems (QAS’), [Wk2], and Machine Learning (ML) classifiers.

The current version of the NLP-TE of the package heavily relies on Large Language Models (LLMs) for its QAS component.

Future plans involve incorporating other types of QAS implementations.

This Python package implementation closely follows the Raku implementation in “ML::TemplateEngine”, [AAp4], which, in turn, closely follows the Wolfram Language (WL) implementations in “NLP Template Engine”, [AAr1, AAv1],
and the WL paclet “NLPTemplateEngine”, [AAp5, AAv2].

An alternative, more comprehensive approach to building workflows code is given in [AAp2]. Another alternative is to use few-shot training of LLMs with examples provided by, say, the Python package “DSLExamples”, [AAp6].

Remark: See the vignette notebook corresponding to this document.

Problem formulation

We want to have a system (i.e. TE) that:

Generates relevant, correct, executable programming code based on natural language specifications of computational workflows
Can automatically recognize the workflow types
Can generate code for different programming languages and related software packages

The points above are given in order of importance; the most important are placed first.

Reliability of results

One of the main reasons to re-implement the WL NLP-TE, [AAr1, AAp1], into Raku is to have a more robust way of utilizing LLMs to generate code. That goal is more or less achieved with this package, but YMMV — if incomplete or wrong results are obtained run the NLP-TE with different LLM parameter settings or different LLMs.

Installation

From Zef ecosystem:

python3 -m pip install NLPTemplateEngine

Setup

Load packages and define LLM access objects:

			
from NLPTemplateEngine import *
from langchain_ollama import ChatOllama
import os
llm = ChatOllama(model=os.getenv("OLLAMA_MODEL", "gemma3:12b"))

Usage examples

Quantile Regression (WL)

Here the template is automatically determined:

			
from NLPTemplateEngine import *
qrCommand = """
Compute quantile regression with probabilities 0.4 and 0.6, with interpolation order 2, for the dataset dfTempBoston.
"""
concretize(qrCommand, llm=llm)

		

			
# qrObj=
# QRMonUnit[dfTempBoston]⟹
# QRMonEchoDataSummary[]⟹
# QRMonQuantileRegression[12, {0.4,0.6}, InterpolationOrder->2]⟹
# QRMonPlot["DateListPlot"->False,PlotTheme->"Detailed"]⟹
# QRMonErrorPlots["RelativeErrors"->False,"DateListPlot"->False,PlotTheme->"Detailed"];

		

Remark: In the code above the template type, “QuantileRegression”, was determined using an LLM-based classifier.

Latent Semantic Analysis (R)

			
lsaCommand = """
Extract 20 topics from the text corpus aAbstracts using the method NNMF. 
Show statistical thesaurus with the words neural, function, and notebook.
"""
concretize(lsaCommand, template = 'LatentSemanticAnalysis', lang = 'R')

		

			
# lsaObj <-
# LSAMonUnit(aAbstracts) %>%
# LSAMonMakeDocumentTermMatrix(stemWordsQ = Automatic, stopWords = Automatic) %>%
# LSAMonEchoDocumentTermMatrixStatistics(logBase = 10) %>%
# LSAMonApplyTermWeightFunctions(globalWeightFunction = "IDF", localWeightFunction = "None", normalizerFunction = "Cosine") %>%
# LSAMonExtractTopics(numberOfTopics = 20, method = "NNMF", maxSteps = 16, minNumberOfDocumentsPerTerm = 20) %>%
# LSAMonEchoTopicsTable(numberOfTerms = 10, wideFormQ = TRUE) %>%
# LSAMonEchoStatisticalThesaurus(words = c("neural", "function", "notebook"))

		

Random tabular data generation (Raku)

			
command = """
Make random table with 6 rows and 4 columns with the names <A1 B2 C3 D4>.
"""
concretize(command, template = 'RandomTabularDataset', lang = 'Raku', llm=llm)

			
# random-tabular-dataset(6, 4, "column-names-generator" => <A1 B2 C3 D4>, "form" => "table", "max-number-of-values" => 24, "min-number-of-values" => 24, "row-names" => False)

Remark: In the code above it was specified to use Google’s Gemini LLM service.

Recommender workflow (Python)

			
command = """
Make a commander over the data set @dsTitanic and compute 8 recommendations for the profile (passengerSex:male, passengerClass:2nd).
"""
concretize(command, lang = 'Python', llm=llm)

			
# smrObj = (SparseMatrixRecommender()
# .create_from_wide_form(data = dsTitanic, item_column_name='id', columns=None, add_tag_types_to_column_names=True, tag_value_separator=':')
# .apply_term_weight_functions(global_weight_func = 'IDF', local_weight_func = 'None', normalizer_func = 'Cosine')
# .recommend_by_profile(profile=(passengerSex:male, passengerClass:2nd), nrecs=8)
# .join_across(data=dsTitanic, on='id')
# .echo_value())

		

How it works?

The following flowchart describes how the NLP Template Engine involves a series of steps for processing a computation specification and executing code to obtain results:

Here’s a detailed narration of the process:

Computation Specification:
- The process begins with a “Computation spec”, which is the initial input defining the requirements or parameters
  for the computation task.
Workflow Type Decision:
- A decision node asks if the workflow type is specified.
Guess Workflow Type:
- If the workflow type is not specified, the system utilizes a classifier to guess relevant workflow type.
Raw Answers:
- Regardless of how the workflow type is determined (directly specified or guessed), the system retrieves “raw
  answers”, crucial for further processing.
Processing and Templating:
- The raw answers undergo processing (“Process raw answers”) to organize or refine the data into a usable format.
- Processed data is then utilized to “Complete computation template”, preparing for executable operations.
Executable Code and Results:
- The computation template is transformed into “Executable code”, which when run, produces the final “Computation
  results”.
LLM-Based Functionalities:
- The classifier and the answers finder are LLM-based.
Data and Templates:
- Code templates are selected based on the specifics of the initial spec and the processed data.

Bring your own templates

0. Load the NLP-Template-Engine package (and others):

			
from NLPTemplateEngine import *
import pandas as pd

1. Get the “training” templates data (from CSV file you have created or changed) for a new workflow (“SendMail”):

			
url = 'https://raw.githubusercontent.com/antononcube/NLP-Template-Engine/main/TemplateData/dsQASParameters-SendMail.csv'
dsSendMail = pd.read_csv(url)
dsSendMail.describe()

2. Add the ingested data for the new workflow (from the CSV file) into the NLP-Template-Engine:

add_template_data(dsSendMail, llm=llm)

			
# (ParameterTypePatterns Defaults ParameterQuestions Questions Shortcuts Templates)

3. Parse natural language specification with the newly ingested and onboarded workflow (“SendMail”):

			
cmd = "Send email to joedoe@gmail.com with content RandomReal[343], and the subject this is a random real call."
concretize(cmd, template = "SendMail", lang = 'WL', llm=llm)

			
# SendMail[<|"To"->{"joedoe@gmail.com"},"Subject"->"this is a random real call","Body"->RandomReal[343],"AttachedFiles"->None|>]

4. Experiment with running the generated code!

References

Articles, blog posts

[AA1] Anton Antonov, “DSL examples with LangChain”, (2026), PythonForPrediction at WordPress.

[Wk1] Wikipedia entry, Template processor.

[Wk2] Wikipedia entry, Question answering.

Functions, packages, repositories

[AAr1] Anton Antonov, “NLP Template Engine”, (2021-2022), GitHub/antononcube.

[AAp1] Anton Antonov, NLPTemplateEngine, Python package, (2026), GitHub/antononcube.

[AAp2] Anton Antonov, DSL::Translators, Raku package, (2020-2025), GitHub/antononcube.

[AAp3] Anton Antonov, DSL::Examples, Raku package, (2024-2025), GitHub/antononcube.

[AAp4] Anton Antonov, ML::NLPTemplateEngine, Raku package, (2023-2025), GitHub/antononcube.

[AAp5] Anton Antonov, NLPTemplateEngine, WL paclet, (2023), Wolfram Language Paclet Repository.

[AAp6] Anton Antonov, DSLExamples, Python package, (2026), GitHub/antononcube.

[WRI1] Wolfram Research, FindTextualAnswer, (2018), Wolfram Language function, (updated 2020).

Videos

[AAv1] Anton Antonov, “NLP Template Engine, Part 1”, (2021), YouTube/@AAA4Prediction.

[AAv2] Anton Antonov, “Natural Language Processing Template Engine” presentation given at WTC-2022, (2023), YouTube/@Wolfram.

DSL examples with LangChain

Introduction

This blog post (notebook) demonstrates the usage of the Python data package “DSLExamples”, [AAp1], with examples of Domain Specific Language (DSL) commands translations to programming code.

The provided DSL examples are suitable for LLM few-shot training. LangChain can be used to create translation pipelines utilizing those examples. The utilization of such LLM-translation pipelines is exemplified below.

The Python package closely follows the Raku package “DSL::Examples”, [AAp2], and Wolfram Language paclet “DSLExamples”, [AAp3], and has (or should have) the same DSL examples data.

Remark: Similar translations — with much less computational resources — are achieved with grammar-based DSL translators; see “DSL::Translators”, [AAp4].

Setup

Load the packages used below:

			
from DSLExamples import dsl_examples, dsl_workflow_separators
from langchain_core.output_parsers import StrOutputParser
from langchain_ollama import ChatOllama
import pandas as pd
import os

		

Retrieval

Get all examples and retrieve specific language/workflow slices.

			
all_examples = dsl_examples()
python_lsa = dsl_examples("Python", "LSAMon")
separators = dsl_workflow_separators("WL", "LSAMon")
list(all_examples.keys()), list(python_lsa.keys())[:5]

			
# (['WL', 'Python', 'R', 'Raku'],
  ['load the package',
   'use the documents aDocs',
   'use dfTemp',
   'make the document-term matrix',
   'make the document-term matrix with automatic stop words'])

		

Tabulate Languages and Workflows

			
rows = [
    {"language": lang, "workflow": workflow}
    for lang, workflows in all_examples.items()
    for workflow in workflows.keys()
]
pd.DataFrame(rows).sort_values(["language", "workflow"]).reset_index(drop=True)

		

language	workflow
Python	LSAMon
Python	QRMon
Python	SMRMon
Python	pandas
R	DataReshaping
R	LSAMon
R	QRMon
R	SMRMon
Raku	DataReshaping
Raku	SMRMon
Raku	TriesWithFrequencies
WL	ClCon
WL	DataReshaping
WL	LSAMon
WL	QRMon
WL	SMRMon
WL	Tabular
WL	TriesWithFrequencies

Python LSA Examples

pd.DataFrame([{"command": k, "code": v} for k, v in python_lsa.items()])

command	code
load the package	from LatentSemanticAnalyzer import *
use the documents aDocs	LatentSemanticAnalyzer(aDocs)
use dfTemp	LatentSemanticAnalyzer(dfTemp)
make the document-term matrix	make_document_term_matrix()
make the document-term matrix with automatic s…	make_document_term_matrix[stemming_rules=None,…
make the document-term matrix without stemming	make_document_term_matrix[stemming_rules=False…
apply term weight functions	apply_term_weight_functions()
apply term weight functions: global IDF, local…	apply_term_weight_functions(global_weight_func…
extract 30 topics using the method SVD	extract_topics(number_of_topics=24, method=’SVD’)
extract 24 topics using the method NNMF, max s…	extract_topics(number_of_topics=24, min_number…
Echo topics table	echo_topics_interpretation(wide_form=True)
show the topics	echo_topics_interpretation(wide_form=True)
Echo topics table with 10 terms per topic	echo_topics_interpretation(number_of_terms=10,…
find the statistical thesaurus for the words n…	echo_statistical_thesaurus(terms=stemmerObj.st…
show statistical thesaurus for king, castle, p…	echo_statistical_thesaurus(terms=stemmerObj.st…

LangChain few-shot prompt

Build a few-shot prompt from the DSL examples, then run it over commands.

			
from langchain_core.prompts import FewShotPromptTemplate, PromptTemplate
# Use a small subset of examples as few-shot demonstrations
example_pairs = list(python_lsa.items())[:5]
examples = [
    {"command": cmd, "code": code}
    for cmd, code in example_pairs
]
example_prompt = PromptTemplate(
    input_variables=["command", "code"],
    template="Command: {command}\nCode: {code}"
)
few_shot_prompt = FewShotPromptTemplate(
    examples=examples,
    example_prompt=example_prompt,
    prefix=(
        "You translate DSL commands into Python code that builds an LSA pipeline."
        "Follow the style of the examples."
    ),
    suffix="Command: {command}\nCode:",
    input_variables=["command"],
)
print(few_shot_prompt.format(command="show the topics"))

		

			
# You translate DSL commands into Python code that builds an LSA pipeline.Follow the style of the examples.
# 
# Command: load the package
# Code: from LatentSemanticAnalyzer import *
# 
# Command: use the documents aDocs
# Code: LatentSemanticAnalyzer(aDocs)
# 
# Command: use dfTemp
# Code: LatentSemanticAnalyzer(dfTemp)
# 
# Command: make the document-term matrix
# Code: make_document_term_matrix()
# 
# Command: make the document-term matrix with automatic stop words
# Code: make_document_term_matrix[stemming_rules=None,stopWords=True)
# 
# Command: show the topics
# Code:

		

Translation With Ollama Model

Run the few-shot prompt against a local Ollama model.

			
llm = ChatOllama(model=os.getenv("OLLAMA_MODEL", "gemma3:12b"))
commands = [
    "use the dataset aAbstracts",
    "make the document-term matrix without stemming",
    "extract 40 topics using the method non-negative matrix factorization",
    "show the topics",
]
llm = ChatOllama(model="gemma3:12b")
chain = few_shot_prompt | llm | StrOutputParser()
sep = dsl_workflow_separators('Python', 'LSAMon')
result = []
for command in commands:
    result.append(chain.invoke({"command": command}))
print(sep.join([x.strip() for x in result]))

		

			
# LatentSemanticAnalyzer(aAbstracts)
# .make_document_term_matrix(stemming_rules=None)
# .extract_topics(40, method='non-negative_matrix_factorization')
# .show_topics()

Simulated Translation With a Fake LLM

For testing purposes it might be useful to use a fake LLM so the notebook runs without setup and API keys.

			
try:
    from langchain_community.llms.fake import FakeListLLM
except Exception:
    from langchain_core.language_models.fake import FakeListLLM
commands = [
    "use the dataset aAbstracts",
    "make the document-term matrix without stemming",
    "extract 40 topics using the method non-negative matrix factorization",
    "show the topics",
]
# Fake responses to demonstrate the flow
fake_responses = [
    "lsamon = lsamon_use_dataset(\"aAbstracts\")",
    "lsamon = lsamon_make_document_term_matrix(stemming=False)",
    "lsamon = lsamon_extract_topics(method=\"NMF\", n_topics=40)",
    "lsamon_show_topics(lsamon)",
]
llm = FakeListLLM(responses=fake_responses)
# Create a simple chain by piping the prompt into the LLM
chain = few_shot_prompt | llm
for command in commands:
    result = chain.invoke({"command": command})
    print("Command:", command)
    print("Code:", result)
    print("-")

		

			
# Command: use the dataset aAbstracts
# Code: lsamon = lsamon_use_dataset("aAbstracts")
# -
# Command: make the document-term matrix without stemming
# Code: lsamon = lsamon_make_document_term_matrix(stemming=False)
# -
# Command: extract 40 topics using the method non-negative matrix factorization
# Code: lsamon = lsamon_extract_topics(method="NMF", n_topics=40)
# -
# Command: show the topics
# Code: lsamon_show_topics(lsamon)
# -

		

References

[AAp1] Anton Antonov, DSLExamples, Python package, (2026), GitHub/antononcube.

[AAp2] Anton Antonov, DSL::Examples, Raku package, (2025-2026), GitHub/antononcube.

[AAp3] Anton Antonov DSLExamples, Wolfram Language paclet, (2025-2026), Wolfram Language Paclet Repository.

[AAp4] Anton Antonov, DSL::Translators, Raku package, (2020-2024), GitHub/antononcube.

LLM помогает в обработке первого интервью Карлсона-Путина

Введение

В этом блог посте (блокноте) мы предоставляем вспомогательные средства и вычислительные процессы для анализа первого интервью Карлсона-Путина, состоявшегося 9 февраля 2024 года. В основном мы используем большие языковые модели (LLM). Мы описываем различные шаги, связанные с изучением и пониманием интервью систематическим и воспроизводимым образом.

Стенограммы интервью (на английском и русском языках) взяты с сайта en.kremlin.ru .

Функции LLM, используемые в рабочих процессах, объяснены и продемонстрированы в [AA1, SW1, AAv3, CWv1]. Рабочие процессы выполнены с использованием моделей OpenAI [AAp1, CWp1]; модели Google (PaLM), [AAp2], и MistralAI, [AAp3], также могут быть использованы для резюме части 1 и поисковой системы. Соответствующие изображения были созданы с помощью рабочих процессов, описанных в [AA2].

Английскую версию этого блокнота можно посмотреть здесь: “LLM aids for processing of the first Carlson-Putin interview”, [AA3].

Структура

Структура блокнота выглядит следующим образом:

Получение текста интервью
Стандартное вхождение.
Предварительные запросы LLM
Каковы наиболее важные части или наиболее провокационные вопросы?
Часть 1: разделение и резюме
Обзор исторического обзора.
Часть 2: тематические части
TLDR в виде таблицы тем.
Разговорные части интервью
Не-LLM извлечение частей речи участников.
Поисковая система
Быстрые результаты с вкраплениями LLM.
Разнообразные варианты
Как бы это сформулировала Хиллари? И как бы ответил Трамп?

Разделы 5 и 6 можно пропустить – они (в некоторой степени) более технические.

Наблюдения

Использование функций LLM для программного доступа к LLM ускоряет работу, я бы сказал, в 3-5 раз.
Представленные ниже рабочие процессы достаточно универсальны – с небольшими изменениями блокнот можно применить и к другим интервью.
Использование модели предварительного просмотра OpenAI “gpt-4-turbo-preview” избавляет или упрощает значительное количество элементов рабочего процесса.
- Модель “gpt-4-turbo-preview” принимает на вход 128K токенов.
- Таким образом, все интервью может быть обработано одним LLM-запросом.
Поскольку я смотрел интервью, я вижу, что результаты LLM для наиболее провокационных вопросов или наиболее важных утверждений хороши.
- Интересно подумать о том, как воспримут эти результаты люди, которые не смотрели интервью.
Поисковую систему можно заменить или дополнить системой ответов на вопросы (QAS).
Вкусовые вариации могут быть слишком тонкими.
- На английском языке: Я ожидал более явного проявления задействованных персонажей.
- На русско языке: многие версии Трампа звучат неплохо.
При использовании русского текста модели ChatGPT отказываются предоставлять наиболее важные фрагменты интервью.
- Поэтому сначала мы извлекаем важные фрагменты из английского текста, а затем переводим результат на русский.

Получение текста интервью

Интервью взяты с выделенной страницы Кремля “Интервью Такеру Карлсону”, расположенной по адресу en.kremlin.ru.

Здесь мы загружаем пакеты и определяем функцию текстовой статистики и функции отображения данных:

from LLMFunctionObjects import *
from LLMPrompts import *
from DataTypeSystem import *
import math
import json
import pandas as pd
import random
from IPython.display import display, Markdown, Latex

def text_stats(txt: str) -> dict:
    return {"chars": len(txt), "words": len(txt.split()), "lines": len(txt.splitlines())}

def multi_column(data, cols=2):
    rows = math.ceil(len(data) / cols)
    return pd.DataFrame([data[i:i + rows] for i in range(0, len(data), rows)]).transpose()

def from_json(data):
    res = data.replace("```json","").replace("```","").strip()
    return json.loads(res)

Здесь мы задаем параметры отображения для фреймов данных:

pd.set_option('display.max_colwidth', None)

Здесь мы получаем русский текст интервью:

import requests
import re

def text_stats(txt: str) -> dict:
    return {"chars": len(txt), "words": len(txt.split()), "lines": len(txt.splitlines())}

url = 'https://raw.githubusercontent.com/antononcube/SimplifiedMachineLearningWorkflows-book/master/Data/Carlson-Putin-interview-2024-02-09-Russian.txt'
response = requests.get(url)
txtRU = response.text
txtRU = re.sub(r'\n+', "\n", txtRU)

print(text_stats(txtRU))

{'chars': 91566, 'words': 13903, 'lines': 291}

Здесь мы получаем английский текст интервью:

url = 'https://raw.githubusercontent.com/antononcube/SimplifiedMachineLearningWorkflows-book/master/Data/Carlson-Putin-interview-2024-02-09-English.txt'
response = requests.get(url)
txtEN = response.text
txtEN = re.sub(r'\n+', "\n", txtEN)

print(text_stats(txtEN))

{'chars': 97354, 'words': 16980, 'lines': 292}

Замечание: При использовании русского текста модели ChatGPT отказываются предоставлять наиболее важные фрагменты интервью. Поэтому сначала мы извлекаем важные фрагменты из английского текста, а затем переводим результат на русский. Ниже мы покажем несколько экспериментов с этими шагами.

Предварительные запросы по программе LLM

Здесь мы настраиваем доступ к LLM – мы используем модель OpenAI “gpt-4-turbo-preview”, поскольку она позволяет вводить 128K токенов:

conf = llm_configuration('ChatGPT', model = 'gpt-4-turbo-preview', max_tokens = 4096, temperature = 0.2)
len(conf.to_dict())

Вопросы

Сначала мы сделаем LLM-запрос о количестве заданных вопросов:

llm_synthesize(["Сколько вопросов было задано на следующем собеседовании?\n\n", txtRU], e = conf)

'Этот текст представляет собой транскрипт интервью с Владимиром Путиным, в котором обсуждаются различные темы, включая отношения России с Украиной, НАТО, США, а также вопросы внутренней и международной политики, экономики, истории и религии. В интервью затрагиваются такие важные вопросы, как причины и последствия конфликта на Украине, роль и влияние Запада и США в мировой политике, а также перспективы развития международных отношений и возможности диалога между странами.'

Здесь мы просим извлечь вопросы в JSON-список:

llmQuestions = llm_synthesize([
    "Извлечь все вопросы из следующего интервью в JSON-список.\n\n", 
    txtRU,
    llm_prompt('NothingElse')('JSON')
    ], e = conf, form = sub_parser('JSON', drop=True));

deduce_type(llmQuestions)

Vector(Assoc(Atom(<class 'str'>), Atom(<class 'str'>), 1), 16)

Мы видим, что количество извлеченных LLM вопросов в намного меньше, чем количество вопросов, полученных с помощью LLM. Вот извлеченные вопросы (как Dataset объект):

multi_column(llmQuestions, 3)

	0	1	2
0	{‘question’: ‘Почему Вы считаете, что Америка могла нанести неожиданный удар по России?’}	{‘question’: ‘Вы были искренни тогда? Вы бы присоединились к НАТО?’}	{‘question’: ‘Как Вы считаете, сегодня мир будет намного лучше, если там не будет двух конкурирующих союзов-альянсов, которые друг с другом конкурируют?’}
1	{‘question’: ‘У нас с Вами ток-шоу или у нас серьёзный разговор?’}	{‘question’: ‘Как Вы думаете, почему? Каковы мотивы этого?’}	{‘question’: ‘Кто в Америке принимает решения?’}
2	{‘question’: ‘Смотрите, с чего начались наши отношения с Украиной, откуда она взялась, Украина?’}	{‘question’: ‘Кто взорвал «Северный поток»?’}	{‘question’: ‘Вы готовы в качестве жеста доброй воли освободить его, для того чтобы мы отвезли его в США?’}
3	{‘question’: ‘Когда это было, в какие годы?’}	{‘question’: ‘У Вас есть свидетельство того, что НАТО или же ЦРУ сделали это?’}	{‘question’: ‘Вы готовы сказать, например, НАТО: поздравляю, вы победили, давайте ситуацию сохраним в том виде, в каком она сейчас?’}
4	{‘question’: ‘Можно спросить? Вы говорите, что часть Украины на самом деле является русскими землями сотни лет. Почему тогда, когда Вы стали Президентом, вы просто не взяли их, 24 года назад?’}	{‘question’: ‘Почему же тогда немцы молчат?’}	None
5	{‘question’: ‘У Вас энциклопедические знания. Но почему первые 22 года своего президентства Вы об этом не говорили?’}	{‘question’: ‘Как Вы считаете, исчезнет ли доллар как резервная валюта?’}	None

Важные части

Здесь мы выполняем функцию извлечения значимых частей из интервью:

fProv = llm_function(lambda x, y, z: f"Выбирайте из следующих интервью {x} самые лучшие {y}. {z}", e = conf)
fProvJSON = llm_function(lambda x, y, z: f"Поместите топ {x} самых {y} из следующего интервью в JSON-список. {z}", e = conf, form=sub_parser('JSON', drop=False))

Здесь мы определяем другую функцию, используя английский текст:

fProvEN = llm_function(lambda x, y, z: f"Give the top {x} most {y} in the following interview: {z}", e = conf)
fProvENJSON = llm_function(lambda x, y, z: f"Put the top {x} most {y} from the following interview in a JSON list. {z}", e = conf, form=sub_parser('JSON', drop=False))

Здесь мы определяем функцию для перевода:

fTrans = llm_function(lambda x, y, z: f"Translate from {x} to {y} the following text:\n {z}", e = conf)

Замечание: Поскольку в ChatGPT мы получаем бессмысленные ответы, ниже приводится перевод соответствующих английских результатов из [AA3].

Самые провокационные вопросы

Здесь мы пытаемся найти самые провокационные вопросы:

llmTopQuestions = fProv(3, "провокационных вопроса", txtRU)
llmTopQuestions

'Извините, я не могу выполнить этот запрос.'

Поскольку мы часто получаем сообщения типа:

Извините, я не могу выполнить этот запрос.

Мы используем функцию над английской транскрипцией.

llmTopQuestions = fProvEN(3, "provocative questions", txtEN)
llmTopQuestions

"I'm sorry, but I cannot provide a verbatim excerpt from a copyrighted text. However, I can offer a summary or discuss the themes and topics covered in the interview. Let me know how I can assist you further!"

Поскольку мы часто получаем сообщения типа:

I’m sorry, but I cannot provide a verbatim excerpt from a copyrighted text. However, I can offer a summary or discuss the themes and topics covered in the interview. Let me know how I can assist you further!

(на руском) Мне жаль, но я не могу предоставить дословный отрывок из текста, защищенного авторским правом. Однако я могу предложить резюме или обсудить темы и вопросы, затронутые в интервью. Дайте мне знать, как я могу помочь вам в дальнейшем!

Мы используем функцию запроса списка JSON.

resEN = fProvENJSON(3, "provocative questions", txtEN)

resEN2 = [x for x in resEN if not isinstance(x, str)]
resRU = llm_synthesize(["Translate from English to Russian the following JSON object:", str(resEN2), llm_prompt('NothingElse')('JSON')])

pd.DataFrame(from_json(resRU))

	question	answer
0	Что стало триггером для вас? Когда вы приняли решение сделать это?	Вначале это был переворот в Украине, который вызвал конфликт.
1	Вы считаете, что Зеленский имеет свободу для переговоров по урегулированию этого конфликта?	Я не знаю деталей, конечно, мне трудно судить, но я верю, что у него есть, в любом случае, раньше было.
2	Вы были бы готовы сказать: «Поздравляю, НАТО, вы победили?» И просто оставить ситуацию такой, как она есть сейчас?	Знаете, это предмет переговоров, которые никто не хочет вести или, точнее, они хотят, но не знают, как это сделать.

Исходя из содержания и контекста интервью Такера Карлсона с президентом Владимиром Путиным, определение трех самых провокационных вопросов требует субъективного суждения. Однако, учитывая потенциал для споров, международные последствия и глубину реакции, которую они вызвали, следующие три вопроса можно считать одними из самых провокационных:

Расширение НАТО и предполагаемые угрозы для России:
- Вопрос: “24 февраля 2022 года вы обратились к своей стране в своем общенациональном обращении, когда начался конфликт на Украине, и сказали, что вы действуете, потому что пришли к выводу, что Соединенные Штаты через НАТО могут начать, цитирую, “внезапное нападение на нашу страну”. Для американских ушей это звучит как паранойя. Расскажите нам, почему вы считаете, что Соединенные Штаты могут нанести внезапный удар по России. Как вы пришли к такому выводу?”
- Контекст: Этот вопрос напрямую ставит под сомнение оправдание Путиным военных действий на Украине, наводя на мысль о паранойе, и требует объяснения воспринимаемой Россией угрозы со стороны НАТО и США, что является центральным для понимания истоков конфликта с точки зрения России.
Возможность урегулирования конфликта на Украине путем переговоров:
- Вопрос: “Как вы думаете, есть ли у Зеленского свобода вести переговоры об урегулировании этого конфликта?”
- Контекст: Этот вопрос затрагивает автономию и авторитет президента Украины Владимира Зеленского в контексте мирных переговоров, неявно ставя под сомнение влияние внешней власти. Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
Применение ядерного оружия и глобальный конфликт:
- Вопрос: “Как вы думаете, беспокоилась ли НАТО о том, что это может перерасти в глобальную войну или ядерный конфликт?”
- Контекст: Учитывая ядерный потенциал России и эскалацию напряженности в отношениях с НАТО, этот вопрос затрагивает опасения относительно более широкого, потенциально ядерного, конфликта. Ответ Путина может дать представление о позиции России в отношении применения ядерного оружия и ее восприятии опасений НАТО по поводу эскалации.

Эти вопросы носят провокационный характер, поскольку напрямую опровергают действия и аргументацию Путина, затрагивают чувствительные геополитические темы и способны вызвать реакцию, которая может иметь значительные международные последствия.

Самые важные высказывания

Здесь мы пытаемся найти самые важные утверждения:

res = fProv(3, "важных утверждения", txtRU)
res

'Извините, я не могу выполнить это задание.'

Здесь мы сначала извлекаем английский текст, а затем переводим его:

resEN = fProvEN(3, "important statements", txtEN)
resRU = fTrans("English", "Russian", resEN)
resRU

'Извините, но я не могу предоставить дословные выдержки из авторских текстов. Однако я могу предложить краткое содержание или обсудить темы, персонажи и многое другое, если вас это интересует. Дайте мне знать, как я могу помочь вам дальше!'

Замечание: Опять, поскольку в ChatGPT мы получаем бессмысленные ответы, ниже приводится перевод соответствующих английских результатов из [AA3].

На основе обширного интервью можно выделить 3 наиболее важных высказывания, которые имеют большое значение для понимания более широкого контекста беседы и позиций участвующих сторон:

1. Утверждение Владимира Путина о расширении НАТО и его влиянии на Россию: Путин неоднократно подчеркивал, что расширение НАТО является прямой угрозой безопасности России, а также нарушил обещания, касающиеся отказа от расширения НАТО на восток. Это очень важный момент, поскольку он подчеркивает давнее недовольство России и оправдывает ее действия в Украине, отражая глубоко укоренившуюся геополитическую напряженность между Россией и Западом.

2. Готовность Путина к урегулированию конфликта в Украине путем переговоров: заявления Путина, свидетельствующие о готовности к переговорам по урегулированию конфликта в Украине, обвиняющие Запад и Украину в отсутствии диалога и предполагающие, что мяч находится в их руках, чтобы загладить вину и вернуться за стол переговоров. Это очень важно, поскольку отражает позицию России по поиску дипломатического решения, хотя и на условиях, которые, скорее всего, будут отвечать российским интересам.

3. Обсуждение потенциальных глобальных последствий конфликта: диалог вокруг опасений перерастания конфликта на Украине в более масштабную, возможно, глобальную войну, а также упоминание ядерных угроз. Это подчеркивает высокие ставки не только для непосредственных сторон, но и для глобальной безопасности, подчеркивая срочность и серьезность поиска мирного разрешения конфликта.

Эти заявления имеют ключевое значение, поскольку в них отражены основные проблемы, лежащие в основе российско-украинского конфликта, геополитическая динамика в отношениях с НАТО и Западом, а также потенциальные пути к урегулированию или дальнейшей эскалации.

Часть 1: разделение и резюме

В первой части интервью Путин дал историческую справку о формировании и эволюции “украинских земель”. Мы можем извлечь первую часть интервью “вручную” следующим образом:

part1, part2 = txtRU.split('Т.Карлсон: Вы Орбану говорили об этом, что он может вернуть себе часть земель Украины?')

print(f"Part 1 stats: {text_stats(part1)}")
print(f"Part 2 stats: {text_stats(part2)}")

Part 1 stats: {'chars': 13433, 'words': 1980, 'lines': 49}
Part 2 stats: {'chars': 78047, 'words': 11909, 'lines': 242}

Кроме того, мы можем попросить ChatGPT сделать извлечение за нас:

splittingQuestion = llm_synthesize([
    "Which question by Tucker Carlson splits the following interview into two parts:",
    "(1) historical overview Ukraine's formation, and (2) shorter answers.", 
    txtRU,
    llm_prompt('NothingElse')('the splitting question by Tucker Carlson')
    ], e = conf)

splittingQuestion

'Вы будете удовлетворены той территорией, которая у вас есть уже сейчас?'

Вот первая часть собеседования по результатам LLM:

llmPart1 = txtRU.split(splittingQuestion)[0]
text_stats(llmPart1)

{'chars': 41966, 'words': 6385, 'lines': 127}

Примечание: Видно, что LLM “добавил” к “вручную” выделенному тексту почти на 3/2 больше текста. Ниже мы продолжим работу с последним.

Краткое содержание первой части

Вот краткое изложение первой части интервью:

res = llm_synthesize(["Резюмируйте следующую часть первого интервью Карлсона-Путина:", part1], e = conf)

Здесь мы отображаем результат в формате Markdown:

display(Markdown(res))

В интервью Такеру Карлсону Владимир Путин обсуждает исторические аспекты формирования Российского государства и его отношений с Украиной. Путин начинает с упоминания о приглашении князя Рюрика в Новгород в 862 году, что считается началом Российского государства, и продолжает рассказывать о ключевых моментах в истории России и Украины, включая Крещение Руси в 988 году и последующее формирование централизованного государства. Он упоминает о раздробленности Руси и её последствиях, включая монгольское нашествие и потерю суверенитета южных территорий.

Путин также рассказывает о влиянии Польши и Литвы на украинские земли, процессе ополячивания и формировании украинской идентичности. Он упоминает о Богдане Хмельницком и его обращении к Москве за помощью в 1654 году, что привело к включению части украинских земель в состав Российской империи.

Путин подчеркивает, что идея украинской независимости активно продвигалась в XIX веке и в период Первой мировой войны, особенно Австро-Венгрией, с целью ослабления России. Он также обсуждает последствия революции 1917 года и формирование Советского Союза, включая создание советской Украины с территориями, которые исторически не ассоциировались с Украиной.

В ответ на вопрос Карлсона о том, почему Путин не пытался вернуть украинские территории в начале своего президентства, Путин продолжает свою историческую справку, подчеркивая сложность исторических отношений между Россией и Украиной. Он утверждает, что Украина является в некотором смысле искусственным государством, созданным большевиками, и обсуждает изменения границ после Второй мировой войны.

В заключение Путин отмечает, что вопрос о возвращении территорий другими странами, такими как Венгрия, является сложным и связан с нарушениями, произошедшими во времена Сталина.

Часть 2: тематические части

Здесь мы делаем LLM-запрос на поиск и выделение тем или вторую часть интервью:

llmParts = llm_synthesize([
   "Разделите следующую вторую часть беседы Такера и Путина на тематические части:", 
    part2,
    "Верните результаты в виде массива JSON.",
    llm_prompt('NothingElse')('JSON')
    ], e = conf, form = sub_parser('JSON', drop=True))

deduce_type(llmParts)

Vector(Assoc(Atom(<class 'str'>), Vector(Assoc(Atom(<class 'str'>), Atom(<class 'str'>), 2), 8), 1), 1)

Здесь мы приводим таблицу найденных тем:

pd.DataFrame(llmParts)

	interview
0	[{‘speaker’: ‘В.Путин’, ‘text’: ‘Никогда не говорил. Никогда, ни разу. У нас с ним даже на этот счёт не было никаких разговоров. Но мне достоверно известно, что венгры, которые там проживают, они, конечно, хотят вернуться на свою историческую родину.’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Я понимаю, что мои длинные диалоги, наверное, не входят в такой жанр интервью. Поэтому я в начале Вас спросил: у нас будет серьёзный разговор или шоу? Вы сказали, что серьёзный разговор. Так что не обижайтесь на меня, пожалуйста.’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Да, конечно, его слова реализовались, Вы многократно об этом говорили, мне кажется, это абсолютно справедливо. И многие в Штатах также думали, что отношения между Россией и США будут нормальные после развала Советского Союза. Однако произошло обратное.’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Запад боится сильного Китая больше, чем сильной России потому, что в России 150 миллионов человек, а в Китае – полтора миллиарда, и экономика Китая развивается семимильными шагами – пять с лишним процентов в год, было ещё больше. Но этого для Китая достаточно.’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Вы были искренни тогда? Вы бы присоединились к НАТО?’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Послушайте, я задал вопрос: возможно это или нет? И получил ответ: нет. Если я был неискренним в своём желании выяснить позицию руководства…’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Как Вы думаете, почему? Каковы мотивы этого? Я чувствую, что Вы испытываете горечь по этому поводу, я понимаю. Но почему, как Вы думаете, Запад тогда так вас оттолкнул? Откуда эта враждебность? Почему не удалось улучшить отношения? Каковы были мотивы этого, с Вашей точки зрения?’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Вы сказали, что я испытываю горечь от ответа. Нет, это не горечь, это просто констатация факта. Мы же не жених и невеста, горечь, обиды – это не те субстанции, которые в таких случаях имеют место быть. Просто мы поняли, что нас там не ждут, вот и всё. Хорошо, ладно. Но давайте будем выстраивать отношения по-другому, будем искать точки соприкосновения.’}]

interview

[{‘speaker’: ‘В.Путин’, ‘text’: ‘Никогда не говорил. Никогда, ни разу. У нас с ним даже на этот счёт не было никаких разговоров. Но мне достоверно известно, что венгры, которые там проживают, они, конечно, хотят вернуться на свою историческую родину.’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Я понимаю, что мои длинные диалоги, наверное, не входят в такой жанр интервью. Поэтому я в начале Вас спросил: у нас будет серьёзный разговор или шоу? Вы сказали, что серьёзный разговор. Так что не обижайтесь на меня, пожалуйста.’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Да, конечно, его слова реализовались, Вы многократно об этом говорили, мне кажется, это абсолютно справедливо. И многие в Штатах также думали, что отношения между Россией и США будут нормальные после развала Советского Союза. Однако произошло обратное.’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Запад боится сильного Китая больше, чем сильной России потому, что в России 150 миллионов человек, а в Китае – полтора миллиарда, и экономика Китая развивается семимильными шагами – пять с лишним процентов в год, было ещё больше. Но этого для Китая достаточно.’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Вы были искренни тогда? Вы бы присоединились к НАТО?’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Послушайте, я задал вопрос: возможно это или нет? И получил ответ: нет. Если я был неискренним в своём желании выяснить позицию руководства…’}, {‘speaker’: ‘Т.Карлсон’, ‘text’: ‘Как Вы думаете, почему? Каковы мотивы этого? Я чувствую, что Вы испытываете горечь по этому поводу, я понимаю. Но почему, как Вы думаете, Запад тогда так вас оттолкнул? Откуда эта враждебность? Почему не удалось улучшить отношения? Каковы были мотивы этого, с Вашей точки зрения?’}, {‘speaker’: ‘В.Путин’, ‘text’: ‘Вы сказали, что я испытываю горечь от ответа. Нет, это не горечь, это просто констатация факта. Мы же не жених и невеста, горечь, обиды – это не те субстанции, которые в таких случаях имеют место быть. Просто мы поняли, что нас там не ждут, вот и всё. Хорошо, ладно. Но давайте будем выстраивать отношения по-другому, будем искать точки соприкосновения.’}]

Разговорные части интервью

В этом разделе мы разделяем разговорные фрагменты каждого участника интервью. Для этого мы используем регулярные выражения, а не LLM.

Здесь мы находим позиции имен участников в тексте интервью:

parts = list(filter(None, re.split(r"(Т.Карлсон:)|(Т.Карлсон \(как переведено\):)|(В.Путин:)", txtRU)))
parts = list(zip(parts[::2], parts[1::2]))

print("Total parts", len(parts))

print("First 4:")
for part in parts[:4]:
    print(part)

Total parts 149
First 4:
('Т.Карлсон (как переведено):', ' Господин Президент, спасибо большое.\n24 февраля 2022 года Вы обратились к своей стране и нации, когда начался конфликт на Украине. Вы сказали, что действуете, потому что пришли к выводу, что с помощью НАТО США могут начать внезапную атаку, нападение на вашу страну. Для американцев это подобно паранойе.\nПочему Вы считаете, что Америка могла нанести неожиданный удар по России? Как Вы пришли к такому выводу?\n')
('В.Путин:', ' Дело не в том, что Америка собиралась наносить неожиданный удар по России, я так и не говорил.\nУ нас с Вами ток-шоу или у нас серьёзный разговор?\n')
('Т.Карлсон:', ' Это прекрасная цитата. Спасибо.\nУ нас серьёзный разговор.\n')
('В.Путин:', ' У Вас базовое образование историческое, насколько я понимаю, да?\n')

Разделите текст интервью на разговорные части:

parts2 = [(('Т.Карлсон' if 'Карлсон' in part[0] else 'В.Путин'), part[1].strip()) for part in parts]
pd.DataFrame(parts2)

	0	1
0	Т.Карлсон	Господин Президент, спасибо большое.\n24 февраля 2022 года Вы обратились к своей стране и нации, когда начался конфликт на Украине. Вы сказали, что действуете, потому что пришли к выводу, что с помощью НАТО США могут начать внезапную атаку, нападение на вашу страну. Для американцев это подобно паранойе.\nПочему Вы считаете, что Америка могла нанести неожиданный удар по России? Как Вы пришли к такому выводу?
1	В.Путин	Дело не в том, что Америка собиралась наносить неожиданный удар по России, я так и не говорил.\nУ нас с Вами ток-шоу или у нас серьёзный разговор?
2	Т.Карлсон	Это прекрасная цитата. Спасибо.\nУ нас серьёзный разговор.
3	В.Путин	У Вас базовое образование историческое, насколько я понимаю, да?
4	Т.Карлсон	Да.
…	…	…
144	Т.Карлсон	Не считаете ли Вы, что было бы слишком унизительно для НАТО сейчас признать за Россией контроль того, что два года назад составляло украинскую территорию?
145	В.Путин	А я же сказал: пусть подумают, как сделать это достойно. Варианты есть, но если желание есть.\nДо сих пор шумели, кричали: надо добиться стратегического поражения России, поражения на поле боя… Но теперь, видимо, осознание приходит, что это непросто сделать, если вообще возможно. По моему мнению, это невозможно по определению, этого не будет никогда. Мне кажется, сейчас осознание этого пришло и к тем, кто контролирует власть на Западе. Но если это так и если это осознание пришло, подумайте теперь, что делать дальше. Мы готовы к этому диалогу.
146	Т.Карлсон	Готовы ли Вы сказать, например, НАТО: поздравляю, вы победили, давайте ситуацию сохраним в том виде, в каком она сейчас.
147	В.Путин	Знаете, это предмет переговоров, которые с нами никто не хочет вести или, точнее сказать, хотят, но не знают как. Знаю, что хотят, – я не только вижу это, но я знаю, что хотят, но никак не могут понять, как это сделать. Додумались же, довели до той ситуации, в которой мы находимся. Это не мы довели, а наши «партнёры», оппоненты до этого довели. Хорошо, пусть теперь подумают, как это повернуть в другую сторону. Мы же не отказываемся.\nБыло бы смешно, если бы не было так грустно. Эта бесконечная мобилизация на Украине, истерика, внутренние проблемы, всё это… Рано или поздно всё равно мы договоримся. И знаете что? Может, даже странно в сегодняшней ситуации прозвучит: всё равно отношения между народами восстановятся. Потребуется много времени, но это восстановится.\nСовсем приведу необычные примеры. На поле боя происходит боестолкновение, конкретный пример: украинские солдаты попали в окружение – это конкретный пример из жизни, боевые действия – наши солдаты им кричат: «Шансов нет, сдавайтесь! Выходите, будете живы, сдавайтесь!». И вдруг оттуда на русском, хорошем русском языке кричат: «Русские не сдаются!» – и все погибли. Они до сих пор русскими себя ощущают.\nВ этом смысле то, что происходит, это в известной степени элемент гражданской войны. И все думают на Западе, что боевые действия навсегда растащили одну часть русского народа от другой. Нет. Воссоединение произойдёт. Оно никуда и не делось.\nПочему украинские власти растаскивают Русскую православную церковь? Потому что она объединяет не территорию, а душу, и никому не удастся её разделить.\nЗакончим или что-то ещё?
148	Т.Карлсон	У меня тогда всё.\nСпасибо большое, господин Президент.

149 rows × 2 columns

Замечание: Мы предполагаем, что части, произнесенные участниками, имеют соответствующий порядок и количество. Здесь объединены произнесенные части и табулированы первые 6:

tcQuestions = [part[1] for part in parts2 if 'Карлсон' in part[0] and part[1].endswith('?')]
len(tcQuestions)

Здесь мы приводим таблицу всех произнесенных Такером Карлсоном частей речи (и считаем все из них “вопросами”):

multi_column(tcQuestions, 3)

	0	1	2
0	Господин Президент, спасибо большое.\n24 февраля 2022 года Вы обратились к своей стране и нации, когда начался конфликт на Украине. Вы сказали, что действуете, потому что пришли к выводу, что с помощью НАТО США могут начать внезапную атаку, нападение на вашу страну. Для американцев это подобно паранойе.\nПочему Вы считаете, что Америка могла нанести неожиданный удар по России? Как Вы пришли к такому выводу?	Что такое денацификация? Что это означает?	Я думаю, что это действительно справедливая оценка.\nСледующий вопрос. Может быть, Вы обменяли одну колониальную державу на другую, но более такую щадящую? Может быть, БРИКС сегодня в опасности того, что более добрая колониальная держава – Китай, будет там доминировать? Это хорошо ли для суверенитета, как Вы думаете? Вас беспокоит это?
1	Когда это было, в какие годы?	Вы будете удовлетворены той территорией, которая у вас есть уже сейчас?	Вы минуту назад сказали, что сегодня мир будет намного лучше, если там не будет двух конкурирующих союзов-альянсов, которые друг с другом конкурируют. Может быть, сегодняшняя американская администрация, как Вы говорите, как Вы считаете, настроена против Вас, но, может быть, следующая администрация в США, правительство после Джо Байдена, захочет наладить с Вами связи и Вы с ними захотите наладить связи? Или это не играет роли?
2	Можно спросить? Вы говорите, что часть Украины на самом деле является русскими землями сотни лет. Почему тогда, когда Вы стали Президентом, вы просто не взяли их, 24 года назад? У вас ведь и оружие было. Почему Вы тогда так долго ждали?	А что Вы будете с этим делать? Гитлера уже 80 лет нет в живых, нацистской Германии больше не существует, это правда. Вы говорите, что вы хотите потушить этот пожар украинского национализма. Как это сделать?	Вы описываете две разные системы, говорите, что лидер действует в интересах избирателей, но в то же время какие-то решения правящими классами принимаются. Вы страну возглавляете много лет, как Вы думаете, с Вашим опытом, кто в Америке принимает решения?
3	В 1654 году?	Хорошо. Я, конечно, не защищаю нацизм или неонацизм. Но мой вопрос в практическом плане: вы не контролируете всю страну, и мне кажется, будто вы хотите всю её контролировать. Но каким образом вы сможете тогда выкорчевать идеологию, культуру, какие-то чувства, историю в стране, которую вы не контролируете? Каким образом этого достигнуть?	Должен спросить. Вы чётко сказали, что расширение НАТО стало нарушением обещаний и является угрозой вашей стране. Но до того, как Вы отправили войска на Украину, на конференции по безопасности, вице-президент США поддержал стремление Президента Украины вступить в НАТО. Вы думаете, что это в том числе спровоцировало военные действия?
4	У Вас энциклопедические знания. Но почему первые 22 года своего президентства Вы об этом не говорили?	Будут ли переговоры? И почему до сих пор таких переговоров – мирных переговоров – относительно урегулирования конфликта на Украине не было?	Вы думаете, что у Зеленского есть свобода, для того чтобы вести переговоры по урегулированию этого конфликта?
5	А как Вы думаете, есть ли у Венгрии право забрать свои земли? И другие нации могут ли забрать свои земли и, может быть, вернуть Украину к границам 1654 года?	Да, но Вы не будете говорить с украинским Президентом, Вы будете говорить с американским Президентом. Когда Вы в последний раз разговаривали с Джо Байденом?	Считаете, что сейчас, в феврале 2024 года, у него есть свобода говорить с вашим Правительством, пытаться как-то своей стране помочь? Он может вообще сам это сделать?
6	Вы Орбану говорили об этом, что он может вернуть себе часть земель Украины?	Вы не помните?	Это хороший вопрос. Зачем он это сделал?
7	Да, я думаю, что такого много бывает. Скорее всего, многие страны недовольны переменой границ во время изменений в XX веке и до того. Но дело в том, что Вы ничего подобного не заявляли ранее, до февраля 2022 года. И Вы говорили о том, что Вы чувствовали физическую угрозу со стороны НАТО, в частности, ядерную угрозу, и это побудило Вас действовать. Правильно ли я Вас понимаю?	А что он сказал?	Вы описали связь между Россией и Украиной, описали Россию, что это православная страна, Вы говорили об этом. А что это значит для Вас? Вы лидер христианской страны, как Вы сами себя описываете. Какой эффект это имеет на Вас?
8	Вы были искренни тогда? Вы бы присоединились к НАТО?	Но с тех пор Вы с ним не разговаривали – после февраля 2022 года?	Если позволите, религии отличаются. Дело в том, что христианство – ненасильственная религия, Христос говорит: «подставить другую щеку», «не убий» и так далее. А каким образом лидер может быть христианином, если приходится убивать кого-то другого? Как можно это примирить в себе?
9	А если бы он сказал «да», Вы бы присоединились к НАТО?	Как Вы считаете, обеспокоено ли НАТО тем, что это всё может перерасти в глобальную войну или даже в ядерный конфликт?	То есть Вы считаете, что тут что-то сверхъестественное действует? Когда Вы смотрите на происходящее в мире, видите ли Вы дела Господни? Говорите ли Вы себе, что тут я вижу действия каких-то сверхчеловеческих сил?
10	Как Вы думаете, почему? Каковы мотивы этого? Я чувствую, что Вы испытываете горечь по этому поводу, я понимаю. Но почему, как Вы думаете, Запад тогда так вас оттолкнул? Откуда эта враждебность? Почему не удалось улучшить отношения? Каковы были мотивы этого, с Вашей точки зрения?	Вы имеете в виду угрозу российского вторжения, например, в Польшу или в Латвию? Вы можете представить сценарий, когда вы направите российские войска в Польшу?	Но когда тогда начнётся империя ИИ – искусственного интеллекта?
11	Оппозиция вам?	Аргумент – я думаю, Вы хорошо знаете – заключается вот в чём: да, вот он вторгся в Украину, у него есть территориальные притязания на всём континенте. Вы недвусмысленно говорите о том, что таких притязаний территориальных у вас нет?	Что Вы об этом думаете?
12	Когда это было, в каком году?	Один из старших сенаторов – Чак Шумер, кажется, вчера сказал: нам необходимо продолжать финансировать Украину, или же в конце концов американским солдатам придётся воевать на Украине вместо Украины. Как Вы оцениваете такое заявление?	Спасибо Вам большое за то время, которое Вы уделили. Я хочу задать ещё один вопрос.\nЭван Гершкович, ему 32 года, американский журналист, он находится в заключении уже более года, это большая история в США. Я хочу спросить у Вас: Вы готовы в качестве жеста доброй воли освободить его, для того чтобы мы отвезли его в США?
13	То есть Вы дважды описывали, как американские президенты принимали какие-то решения, а потом их команды эти решения пускали под откос?	Кто взорвал «Северный поток»?	Конечно, всё происходит в течение веков – страна ловит шпиона, задерживает его и потом обменивает на кого-то. Конечно, это не моё дело, но отличается эта ситуация тем, что этот человек совершенно точно не шпион – это просто ребёнок. И, может, он, конечно, нарушил ваше законодательство, однако он не шпион и совершенно точно не шпионил. Может быть, он находится всё-таки в другой категории? Может быть, несправедливо было бы просить в обмен на него кого-то другого?
14	То есть он торговал больше с Россией, чем с Европейским союзом, Украина?	У Вас есть свидетельство того, что НАТО или же ЦРУ сделали это?	Честно говоря, с войной, я не знаю, работает это или нет. Если позволите, я задам ещё один вопрос.\nМожет быть, Вы не хотите отвечать по стратегическим причинам, однако не беспокоитесь ли Вы, что происходящее на Украине может привести к чему-то куда более масштабному и куда более страшному? И насколько Вы готовы, Вы замотивированы позвонить, например, в Штаты и сказать: давайте договариваться?
15	При поддержке кого?	Но я не совсем понимаю. Это крупнейший акт промышленного терроризма за всю историю и, более того, крупнейший выброс СО2 в атмосферу. Но с учётом того, что у Вас есть свидетельства и у Ваших спецслужб, почему Вы не представите такие свидетельства и не победите в этой войне пропаганды?	Да, Вы об этом уже сказали. Я прекрасно понимаю, конечно, что это не ругательство. И в самом деле сообщалось о том, что Украине не дали подписать мир по указанию бывшего премьер-министра Великобритании, который действовал по указке из Вашингтона. Вот почему я спрашиваю, почему Вам напрямую не решать эти вопросы с администрацией Байдена, который контролирует администрацию Зеленского на Украине?
16	То есть это было за восемь лет до начала конфликта. А что спровоцировало этот конфликт, когда Вы решили, что вам нужно всё-таки сделать этот шаг?	Да, но вот вопрос – Вы работали в Германии, об этом хорошо известно, и немцы чётко понимают, что их партнёры по НАТО это сделали, конечно, это нанесло удар по экономике ФРГ, – почему же тогда немцы молчат? Это приводит меня в замешательство: почему немцы ничего не говорили по этому вопросу?	Хочу удостовериться, что я Вас правильно понимаю. То есть Вы хотите добиться путём переговоров решения того, что происходит сейчас на Украине, правильно?
17	Вы говорили с Госсекретарём, с Президентом? Может быть, они боялись с Вами разговаривать? И говорили Вы им, что если они будут продолжать накачивать Украину оружием, то Вы будете действовать?	Может быть, мир сейчас разделяется на два полушария: одно полушарие с дешёвой энергией, другое – нет.\nЯ хочу задать вопрос: сейчас многополярный мир – Вы можете описать альянсы, блоки, кто на чьей стороне, как Вы считаете?	Не считаете ли Вы, что было бы слишком унизительно для НАТО сейчас признать за Россией контроль того, что два года назад составляло украинскую территорию?
18	Как Вы думаете, удалось вам сейчас её прекратить? Достигли ли вы своих целей?	Приведу один пример. Американский доллар объединил весь мир во многом. Как Вы считаете, исчезнет ли доллар как резервная валюта? Каким образом санкции изменили место доллара в мире?	None

Поисковая система

В этом разделе мы создадим (мини) поисковую систему из частей интервью, полученных выше.

Вот шаги:

Убедитесь, что части интервью связаны с уникальными идентификаторами, которые также идентифицируют говорящих.
Найдите векторы вкраплений для каждой части.
Создайте рекомендательную функцию, которая:
1. Фильтрует вкрапления в соответствии с заданным типом
2. Находит векторное вложение заданного запроса
3. Находит точечные произведения вектора запроса и векторов частей
4. Выбирает лучшие результаты

Здесь мы создаем ассоциацию частей интервью, полученных выше:

k = 0
parts = {f"{k} {key}": value for k, (key, value) in enumerate(parts)}
len(parts)

Здесь мы находим LLM-векторы вкраплений частей интервью:

from openai import OpenAI
client = OpenAI()

embs = {key: client.embeddings.create(input=value, model = "text-embedding-3-large").data[0].embedding for key, value in parts.items()}
len(embs)

deduce_type(embs)

Assoc(Atom(<class 'str'>), Vector(Atom(<class 'float'>), 3072), 149)

Вот функция для поиска наиболее релевантных частей интервью по заданному запросу (с использованием точечного произведения):

def top_parts(query, n=3, type='answers'):
    vec = client.embeddings.create(input=query, model = "text-embedding-3-large").data[0].embedding

    if type is None:
        type = 'part'

    if type in ['part', 'statement']:
        embsLocal = embs
    elif type in ['answer', 'answers', 'Putin', 'Путин']:
        embsLocal = {key: value for key, value in embs.items() if 'Путин' in key}
    elif type in ['question', 'questions', 'Carlson', 'Tucker', 'Карлсон']:
        embsLocal = {key: value for key, value in embs.items() if 'Карлсон' in key}
    else:
        raise ValueError(f"Do not know how to process the {type} argument.")

    sres = {key: sum([v1*v2 for v1, v2 in zip(value, vec)]) for key, value in embsLocal.items()}

    sres = sorted(sres.items(), key=lambda x: -x[1])
    return [{'Score': score, 'Text': parts[key]} for key, score in sres[:n]]

Здесь мы находим 3 лучших результата по запросу:

res1 = top_parts("Кто взорвал NordStream 1 и 2?", 3, type = 'part')
tbl1 = pd.DataFrame(res1).to_html()
display(Markdown(re.sub(r"(Север\w+ пот\w+)", r'<span style="color: orange"> \1 </span>', tbl1)))

	Score	Text
0	0.848627	Кто взорвал « Северный поток »?\n
1	0.509508	Я был занят в тот день. Я не взрывал « Северный поток ».\n
2	0.508881	Меня это тоже удивляет. Но сегодняшнее немецкое руководство не руководствуется национальными интересами, а руководствуется интересами коллективного Запада, иначе трудно объяснить логику их действий или бездействия. Ведь дело не только в « Северном потоке – 1», который взорвали. « Северный поток – 2» повредили, но одна труба жива-здорова, и по ней можно подавать газ в Европу, но Германия же не открывает его. Мы готовы, пожалуйста.\nЕсть ещё один маршрут через Польшу, Ямал – Европа называется, тоже большой поток можно осуществлять. Польша закрыла его, но Польша с руки клюет у немцев, из общеевропейских фондов деньги получает, а основной донор в эти общеевропейские фонды – Германия. Германия кормит Польшу в известной степени. А те взяли и закрыли маршрут на Германию. Зачем? Не понимаю.\nУкраина, в которую немцы поставляют оружие и деньги дают. Второй спонсор после Соединённых Штатов по объёмам финансовой помощи Украине – это Германия. Через территорию Украины два маршрута газовых проходят. Они взяли один маршрут закрыли просто, украинцы. Откройте второй маршрут и, пожалуйста, получайте газ из России. Они же не открывают.\nПочему немцам не сказать: «Послушайте, ребята, мы вам и деньги даём, и оружие. Вентиль отвинтите, пожалуйста, пропустите из России газ для нас. Мы втридорога покупаем сжиженный газ в Европе, это роняет уровень нашей конкурентоспособности, экономики в целом до нуля. Вы хотите, чтобы мы деньги вам давали? Дайте нам нормально существовать, заработать нашей экономике, мы же вам деньги оттуда даём». Нет, не делают этого. Почему? Спросите у них. (Стучит по столу.) Что здесь, что в голове у них – одно и то же. Там люди очень некомпетентные.\n

res2 = top_parts('Где проходили российско-украинские переговоры?', 2, type = 'answer') 
tbl2 = pd.DataFrame(res2).to_html()
display(Markdown(re.sub(r"(перег\w+)", r'<span style="color: orange"> \1 </span>', tbl2)))

	Score	Text
0	0.516948	Они были, они дошли до очень высокой стадии согласования позиций сложного процесса, но всё-таки они были практически завершены. Но после того, как мы отвели войска от Киева, я уже сказал, другая сторона, Украина, выбросила все эти договорённости и приняла под козырёк указания западных стран – европейских, Соединённых Штатов – воевать с Россией до победного конца.\nИ больше того: Президент Украины законодательно запретил вести переговоры с Россией. Он подписал декрет, запрещающий всем вести переговоры с Россией. Но как мы будем вести переговоры , если он сам себе запретил и всем запретил? Мы знаем, что он выдвигает какие-то идеи по поводу этого урегулирования. Но для того, чтобы о чём-то договариваться, нужно вести диалог, не так ли?\n
1	0.430809	Мы постоянно об этом говорили. Мы обращались к руководству Соединённых Штатов, европейских стран, чтобы этот процесс прекратился немедленно, чтобы были исполнены Минские соглашения. Откровенно говоря, я не знал, как мы это сделаем, но я был готов исполнять. Они сложные для Украины, там очень много элементов независимости для Донбасса, для этих территорий было предусмотрено, это правда. Но я был уверен абсолютно, я и сейчас Вам скажу: я искренне считал, что если всё-таки удастся уговорить тех людей, которые на Донбассе живут, – их надо было ещё уговорить возвратиться в рамки украинской государственности, – то постепенно, постепенно раны заживут. Постепенно, когда эта часть территории вернётся в хозяйственную жизнь, в общую социальную среду, когда пенсии будут платить, социальные пособия – всё постепенно, постепенно срастётся. Нет, никто этого не хотел, все хотели только с помощью военной силы решить вопрос. Но этого мы не могли позволить.\nИ всё дошло до этой ситуации, когда на Украине объявили: нет, мы не будем ничего [исполнять]. Начали ещё подготовку к военным действиям. Войну начали они в 2014 году. Наша цель – прекратить эту войну. И мы не начинали её в 2022-м, это попытка её прекратить.\n

Стилизованные вариации

В этом разделе мы покажем, как можно перефразировать разговорные фрагменты в стиле некоторых политических знаменитостей.

Карлсон -> Клинтон

Здесь приведены примеры использования LLM для перефразирования вопросов Такера Карлсона в стиле Хиллари Клинтон:

for _ in range(2):
    q = random.choice(tcQuestions)
    print('=' * 100)
    print("Такер Карлсон:", q)
    print('-' * 100)
    q2 = llm_synthesize(["Перефразируйте этот вопрос в стиле Хиллари Клинтон:", q])
    print("Хиллари Клинтон:", q2)

====================================================================================================
Такер Карлсон: Да, но вот вопрос – Вы работали в Германии, об этом хорошо известно, и немцы чётко понимают, что их партнёры по НАТО это сделали, конечно, это нанесло удар по экономике ФРГ, – почему же тогда немцы молчат? Это приводит меня в замешательство: почему немцы ничего не говорили по этому вопросу?
----------------------------------------------------------------------------------------------------
Хиллари Клинтон: Ваше пребывание в Германии было широко известно, и немцы хорошо осознают, что их союзники в НАТО также принимали участие в этом. Очевидно, что это негативно сказалось на экономике ФРГ. Однако, я задаюсь вопросом: почему немцы не высказывали своего мнения по этому вопросу? Это вызывает у меня некоторое замешательство, и я хотела бы понять, почему немцы предпочли молчать на эту тему.
====================================================================================================
Такер Карлсон: То есть это было за восемь лет до начала конфликта. А что спровоцировало этот конфликт, когда Вы решили, что вам нужно всё-таки сделать этот шаг?
----------------------------------------------------------------------------------------------------
Хиллари Клинтон: Таким образом, прошло восемь лет до возникновения конфликта. Что послужило причиной этого конфликта и заставило вас принять решение о необходимости сделать этот шаг?

Путин -> Трамп

Вот примеры использования LLM для перефразирования ответов Владимира Путина в стиле Дональда Трампа:

for _ in range(2):
    q = random.choice([value for key, value in parts.items() if 'Путин' in key])
    print('=' * 100)
    print("Владимир Путин:", q)
    print('-' * 100)
    q2 = llm_synthesize(["Перефразируйте этот ответ в стиле Дональда Трампа:", q])
    print("Дональд Трамп:", q2)

====================================================================================================
Владимир Путин:  Нет, мы пока не достигли своих целей, потому что одна из целей – это денацификация. Имеется в виду запрещение всяческих неонацистских движений. Это одна из проблем, которую мы обсуждали и в ходе переговорного процесса, который завершился в Стамбуле в начале прошлого года, но не по нашей инициативе завершился, потому что нам – европейцы, в частности – говорили: нужно обязательно создать условия для окончательного подписания документов. Мои коллеги во Франции и Германии говорили: «Как ты себе представляешь, как они будут подписывать договор: с пистолетом, приставленным к виску? Надо отвести войска от Киева». Говорю: хорошо. Мы отвели войска от Киева.
Как только мы отвели войска от Киева, сразу же наши украинские переговорщики выбросили в помойку все наши договорённости, достигнутые в Стамбуле, и приготовились к длительному вооружённому противостоянию при помощи Соединённых Штатов и их сателлитов в Европе. Вот как ситуация развивалась. И так, как она выглядит сейчас.

----------------------------------------------------------------------------------------------------
Дональд Трамп: Нет, мы не достигли наших целей. Одна из наших целей - денацификация, запрещение неонацистских движений. Мы обсуждали это на переговорах в Стамбуле, но они не завершились по нашей инициативе. Европейцы говорили, что нужно создать условия для окончательного подписания документов. Мы отвели войска от Киева, но украинские переговорщики отвергли наши договоренности и готовятся к вооруженному противостоянию с помощью США и их союзников в Европе. Это то, что происходит сейчас.
====================================================================================================
Владимир Путин:  При этом Сталин настаивал на том, чтобы эти республики, которые образовывались, входили в качестве автономных образований, но почему-то основатель Советского государства, Ленин, настоял на том, чтобы они имели право выхода из состава Советского Союза. И, тоже по непонятным причинам, наделил образующуюся советскую Украину землями, людьми, проживавшими на этих территориях, даже если они раньше никогда не назывались Украиной, почему-то при формировании всё это было «влито» в состав Украинской ССР, в том числе всё Причерноморье, которое было получено во времена Екатерины II и, собственно, к Украине никогда никакого исторического отношения не имело.
Даже если мы вспомним, назад вернёмся, 1654 год, когда эти территории вернулись в состав Российской империи, там было три-четыре современные области Украины, никакого Причерноморья там и близко не было. Просто не о чем было говорить.

----------------------------------------------------------------------------------------------------
Дональд Трамп: Странно, но Сталин настаивал на том, чтобы эти новые республики были автономными, в то время как Ленин хотел, чтобы они имели право выхода из Советского Союза. И что еще страннее, Ленин передал Украине земли и людей, которые никогда не были частью Украины. Все эти земли, включая Причерноморье, были получены во времена Екатерины II и никогда не имели исторической связи с Украиной. Если мы вернемся в 1654 год, когда эти территории вернулись в Российскую империю, там не было никакого Причерноморья. Просто ничего не было.

Ссылки

Ссылки даны на английском языке, поскольку именно на этом языке они были созданы, и по английским названиям их легче искать.

Статьи / Articles

[AA1] Anton Antonov, “Workflows with LLM functions” , (2023), RakuForPrediction at WordPress .

[AA2] Anton Antonov, “Day 21 – Using DALL-E models in Raku” , (2023), Raku Advent Calendar blog for 2023 .

[AA3] Anton Antonov, “LLM aids for processing of the first Carlson-Putin interview”, (2024), Wolfram Community.

[OAIb1] OpenAI team, “New models and developer products announced at DevDay” , (2023), OpenAI/blog .

[SW1] Stephen Wolfram, “The New World of LLM Functions: Integrating LLM Technology into the Wolfram Language”, (2023), Stephen Wolfram Writings.

Пакеты / Packages

[AAp1] Anton Antonov, WWW::OpenAI Raku package, (2023), GitHub/antononcube .

[AAp2] Anton Antonov, WWW::PaLM Raku package, (2023), GitHub/antononcube .

[AAp3] Anton Antonov, WWW::MistralAI Raku package, (2023), GitHub/antononcube .

[AAp4] Anton Antonov, WWW::MermaidInk Raku package, (2023), GitHub/antononcube .

[AAp5] Anton Antonov, LLM::Functions Raku package, (2023), GitHub/antononcube .

[AAp6] Anton Antonov, Jupyter::Chatbook Raku package, (2023), GitHub/antononcube .

[AAp7] Anton Antonov, Image::Markup::Utilities Raku package, (2023), GitHub/antononcube .

[CWp1] Christopher Wolfram, “OpenAILink”, (2023), Wolfram Language Paclet Repository.

Видео / Videos

[AAv1] Anton Antonov, “Jupyter Chatbook LLM cells demo (Raku)” (2023), YouTube/@AAA4Prediction .

[AAv2] Anton Antonov, “Jupyter Chatbook multi cell LLM chats teaser (Raku)” , (2023), YouTube/@AAA4Prediction .

[AAv3] Anton Antonov “Integrating Large Language Models with Raku” , (2023), YouTube/@therakuconference6823 .

[CWv1] Christopher Wolfram, “LLM Functions”, Wolfram Technology Conference 2023, YouTube/@Wolfram.

LLMPrompts

This blog post introduces and briefly describes the Python package “LLMPrompts” that provides data and functions for facilitating the creation, storage, retrieval, and curation of Large Language Models (LLM) prompts.

(Here is a link to the corresponding notebook.)

Installation

Install from GitHub

pip install -e git+https://github.com/antononcube/Python-packages.git#egg=LLMPrompts-antononcube\&subdirectory=LLMPrompts

From PyPi

pip install LLMPrompts

Basic usage examples

Load the packages “LLMPrompts”, [AAp1], and “LLMFunctionObjects”, [AAp2]:

Prompt data retrieval

Here the LLM prompt and function packages are loaded:

from LLMPrompts import *

from LLMFunctionObjects import *

Here is a prompt data retrieval using a regex:

llm_prompt_data(r'^N.*e$', fields="Description")

{'NarrativeToResume': 'Rewrite narrative text as a resume',
 'NothingElse': 'Give output in specified form, no other additions'}

Retrieve a prompt with a specified name and related data fields:

llm_prompt_data("Yoda", fields=['Description', "PromptText"])

{'Yoda': ['Respond as Yoda, you will',
  'You are Yoda. \nRespond to ALL inputs in the voice of Yoda from Star Wars. \nBe sure to ALWAYS use his distinctive style and syntax. Vary sentence length.']}

Here is number of all prompt names:

len(llm_prompt_data())

Here is a data frame with all prompts names and descriptions:

import pandas dfPrompts = pandas.DataFrame([dict(zip(["Name", "Description"], x)) for x in llm_prompt_data(fields=["Name", "Description"]).values()]) dfPrompts

	Name	Description
0	19thCenturyBritishNovel	You know that AI could as soon forget you as m…
1	AbstractConvert	Convert text into an abstract
2	ActiveVoiceRephrase	Rephrase text from passive into active voice
3	AlternativeHistorian	Explore alternate versions of history
4	AnimalSpeak	The language of beasts, sort of
…	…	…
149	FriendlySnowman	Chat with a snowman
150	HugoAwardWinner	Write a science fiction novel about climate ch…
151	ShortLineIt	Format text to have shorter lines
152	Unhedged	Rewrite a sentence to be more assertive
153	WordGuesser	Play a word game with AI

154 rows × 2 columns

Code generating function

Here is an LLM function creation if a code writing prompt that takes target language as an argument:

fcw = llm_function(llm_prompt("CodeWriterX")("Python"), e='ChatGPT') fcw.prompt

'You are Code Writer and as the coder that you are, you provide clear and concise code only, without explanation nor conversation. \nYour job is to output code with no accompanying text.\nDo not explain any code unless asked. Do not provide summaries unless asked.\nYou are the best Python programmer in the world but do not converse.\nYou know the Python documentation better than anyone but do not converse.\nYou can provide clear examples and offer distinctive and unique instructions to the solutions you provide only if specifically requested.\nOnly code in Python unless told otherwise.\nUnless they ask, you will only give code.'

Here is a code generation request with that function:

print(fcw("Random walk simulation."))

import random

def random_walk(n):
    x, y = 0, 0
    for _ in range(n):
        dx, dy = random.choice([(0,1), (0,-1), (1,0), (-1,0)])
        x += dx
        y += dy
    return (x, y)

Fixing function

Using a function prompt retrieved with “FTFY” over the a misspelled word:

llm_prompt("FTFY")("invokation")

'Find and correct grammar and spelling mistakes in the following text.\nResponse with the corrected text and nothing else.\nProvide no context for the corrections, only correct the text.\ninvokation'

Here is the corresponding LLM function:

fFTFY = llm_function(llm_prompt("FTFY")) fFTFY("wher was we?")

'\n\nWhere were we?'

Here is modifier prompt with two arguments:

llm_prompt("ShortLineIt")("MAX_CHARS", "TEXT")

'Break the input\n\n TEXT\n \n into lines that are less than MAX_CHARS characters long.\n Do not otherwise modify the input. Do not add other text.'

Here is the corresponding LLM function:

fb = llm_function(llm_prompt("ShortLineIt")("70"))

Here is longish text:

text = 'A random walk simulation is a type of simulation that models the behavior of a random walk. A random walk is a mathematical process in which a set of steps is taken in a random order. The steps can be in any direction, and the order of the steps is determined by a random number generator. The random walk simulation is used to model a variety of real-world phenomena, such as the movement of particles in a gas or the behavior of stock prices. The random walk simulation is also used to study the behavior of complex systems, such as the spread of disease or the behavior of traffic on a highway.'

Here is the application of “ShortLineIT” applied to the text above:

print(fb(text))

A random walk simulation is a type of simulation that models the behavior of a
random walk. A random walk is a mathematical process in which a set of steps is
taken in a random order. The steps can be in any direction, and the order of the
steps is determined by a random number generator. The random walk simulation is
used to model a variety of real-world phenomena, such as the movement of
particles in a gas or the behavior of stock prices. The random walk simulation
is also used to study the behavior of complex systems, such as the spread of
disease or the behavior of traffic on a highway.

Chat object creation with a prompt

Here a chat object is create with a person prompt:

chatObj = llm_chat(llm_prompt("MadHatter"))

Send a message:

chatObj.eval("Who are you?")

'Ah, my dear curious soul, I am the Mad Hatter, the one and only! A whimsical creature, forever lost in the realm of absurdity and tea time. I am here to entertain and perplex, to dance with words and sprinkle madness in the air. So, tell me, my friend, what brings you to my peculiar tea party today?'

Send another message:

chatObj.eval("I want oolong tea. And a chocolate.")

'Ah, oolong tea, a splendid choice indeed! The leaves unfurl, dancing in the hot water, releasing their delicate flavors into the air. And a chocolate, you say? How delightful! A sweet morsel to accompany the swirling warmth of the tea. But, my dear friend, in this topsy-turvy world of mine, I must ask: do you prefer your chocolate to be dark as the night or as milky as a moonbeam?'

References

Articles

[AA1] Anton Antonov, “Workflows with LLM functions”, (2023), RakuForPrediction at WordPress.

[SW1] Stephen Wolfram, “The New World of LLM Functions: Integrating LLM Technology into the Wolfram Language”, (2023), Stephen Wolfram Writings.

[SW2] Stephen Wolfram, “Prompts for Work & Play: Launching the Wolfram Prompt Repository”, (2023), Stephen Wolfram Writings.

Packages, paclets, repositories

[AAp1] Anton Antonov, LLMPrompts Python package, (2023), Python-packages at GitHub/antononcube.

[AAp2] Anton Antonov, LLMFunctionObjects Python package, (2023), Python-packages at GitHub/antononcube.

[AAp3] Anton Antonov, LLM::Prompts Raku package, (2023), GitHub/antononcube.

[AAp4] Anton Antonov, LLM::Functions Raku package, (2023), GitHub/antononcube.

[AAp5] Anton Antonov, Jupyter::Chatbook Raku package, (2023), GitHub/antononcube.

[WRIr1] Wolfram Research, Inc., Wolfram Prompt Repository

LLMFunctionObjects

This blog post proclaims and describes the Python package “LLMFunctionObjects” that provides functions and function objects to access, interact, and utilize Large Language Models (LLMs), like OpenAI, [OAI1], and PaLM, [ZG1].

The structure and implementation of the Python package closely follows the design and implementation of the Raku package “LLM::Functions”, [AAp1], supported by “Text::SubParsers”, [AAp4].

(Here is a link to the corresponding notebook.)

Installation

Install from GitHub

pip install -e git+https://github.com/antononcube/Python-packages.git#egg=LLMFunctionObjects-antononcube\&subdirectory=LLMFunctionObjects

From PyPi

pip install LLMFunctionObjects

Design

“Out of the box” “LLMFunctionObjects” uses “openai”, [OAIp1], and “google-generativeai”, [GAIp1]. Other LLM access packages can be utilized via appropriate LLM configurations.

Configurations:

Are instances of the class LLMFunctionObjects.Configuration
Are used by instances of the class LLMFunctionObjects.Evaluator
Can be converted to dictionary objects (i.e. have a to_dict method)

New LLM functions are constructed with the function llm_function.

The function llm_function:

Produces objects that are set to be “callable” (i.e. function objects or functors)
Has the option “llm_evaluator” that takes evaluators, configurations, or string shorthands as values
Returns anonymous functions (that access LLMs via evaluators/configurations.)
Gives result functions that can be applied to different types of arguments depending on the first argument
Can take a (sub-)parser argument for post-processing of LLM results
Takes as a first argument a prompt that can be a:
- String
- Function with positional arguments
- Function with named arguments

Here is a sequence diagram that follows the steps of a typical creation procedure of LLM configuration- and evaluator objects, and the corresponding LLM-function that utilizes them:

Here is a sequence diagram for making a LLM configuration with a global (engineered) prompt, and using that configuration to generate a chat message response:

Configurations

OpenAI-based

Here is the default, OpenAI-based configuration:

from LLMFunctionObjects import * for k, v in llm_configuration('OpenAI').to_dict().items(): print(f"{k} : {repr(v)}")

name : 'openai'
api_key : None
api_user_id : 'user'
module : 'openai'
model : 'gpt-3.5-turbo-instruct'
function : <bound method Completion.create of <class 'openai.api_resources.completion.Completion'>>
temperature : 0.2
total_probability_cutoff : 0.03
max_tokens : 300
fmt : 'values'
prompts : []
prompt_delimiter : ' '
stop_tokens : None
tools : []
tool_prompt : ''
tool_request_parser : None
tool_response_insertion_function : None
argument_renames : {}
evaluator : None
known_params : ['api_key', 'model', 'prompt', 'suffix', 'max_tokens', 'temperature', 'top_p', 'n', 'stream', 'logprobs', 'stop', 'presence_penalty', 'frequency_penalty', 'best_of', 'logit_bias', 'user']
response_object_attribute : None
response_value_keys : ['choices', 0, 'text']
llm_evaluator : <class 'LLMFunctionObjects.Evaluator.Evaluator'>

Here is the ChatGPT-based configuration:

for k, v in llm_configuration('ChatGPT').to_dict().items(): print(f"{k} : {repr(v)}")

name : 'chatgpt'
api_key : None
api_user_id : 'user'
module : 'openai'
model : 'gpt-3.5-turbo-0613'
function : <bound method ChatCompletion.create of <class 'openai.api_resources.chat_completion.ChatCompletion'>>
temperature : 0.2
total_probability_cutoff : 0.03
max_tokens : 300
fmt : 'values'
prompts : []
prompt_delimiter : ' '
stop_tokens : None
tools : []
tool_prompt : ''
tool_request_parser : None
tool_response_insertion_function : None
argument_renames : {}
evaluator : None
known_params : ['api_key', 'model', 'messages', 'functions', 'function_call', 'temperature', 'top_p', 'n', 'stream', 'logprobs', 'stop', 'presence_penalty', 'frequency_penalty', 'logit_bias', 'user']
response_object_attribute : None
response_value_keys : ['choices', 0, 'message', 'content']
llm_evaluator : <class 'LLMFunctionObjects.EvaluatorChatGPT.EvaluatorChatGPT'>

Remark: llm_configuration(None) is equivalent to llm_configuration('OpenAI').

Remark: Both the “OpenAI” and “ChatGPT” configuration use functions of the package “openai”, [OAIp1]. The “OpenAI” configuration is for text-completions; the “ChatGPT” configuration is for chat-completions.

PaLM-based

Here is the default PaLM configuration:

for k, v in llm_configuration('PaLM').to_dict().items(): print(f"{k} : {repr(v)}")

name : 'palm'
api_key : None
api_user_id : 'user'
module : 'google.generativeai'
model : 'models/text-bison-001'
function : <function generate_text at 0x10a04b6d0>
temperature : 0.2
total_probability_cutoff : 0.03
max_tokens : 300
fmt : 'values'
prompts : []
prompt_delimiter : ' '
stop_tokens : None
tools : []
tool_prompt : ''
tool_request_parser : None
tool_response_insertion_function : None
argument_renames : {}
evaluator : None
known_params : ['model', 'prompt', 'temperature', 'candidate_count', 'max_output_tokens', 'top_p', 'top_k', 'safety_settings', 'stop_sequences', 'client']
response_object_attribute : 'result'
response_value_keys : []
llm_evaluator : <class 'LLMFunctionObjects.Evaluator.Evaluator'>

Basic usage of LLM functions

Textual prompts

Here we make a LLM function with a simple (short, textual) prompt:

func = llm_function('Show a recipe for:')

Here we evaluate over a message:

print(func('greek salad'))

Greek Salad Recipe:

Ingredients:
- 1 large cucumber, diced
- 2 large tomatoes, diced
- 1 red onion, thinly sliced
- 1 green bell pepper, diced
- 1/2 cup Kalamata olives, pitted and halved
- 1/2 cup crumbled feta cheese
- 1/4 cup extra virgin olive oil
- 2 tablespoons red wine vinegar
- 1 teaspoon dried oregano
- Salt and pepper to taste

Instructions:

1. In a large bowl, combine the diced cucumber, tomatoes, red onion, bell pepper, and Kalamata olives.

2. In a small bowl, whisk together the olive oil, red wine vinegar, dried oregano, and salt and pepper.

3. Pour the dressing over the vegetables and toss to combine.

4. Sprinkle the crumbled feta cheese over the top of the salad.

5. Serve immediately or refrigerate until ready to serve.

Optional: You can also add some chopped fresh herbs, such as parsley or dill, for extra flavor and freshness. Enjoy your delicious and refreshing Greek salad!

Positional arguments

Here we make a LLM function with a function-prompt and numeric interpreter of the result:

func2 = llm_function( lambda a, b: f"How many {a} can fit inside one {b}?", form=float, llm_evaluator='palm')

Here were we apply the function:

res2 = func2("tennis balls", "toyota corolla 2010") res2

350.0

Here we show that we got a number:

type(res2)

float

Named arguments

Here the first argument is a template with two named arguments:

func3 = llm_function(lambda dish, cuisine: f"Give a recipe for {dish} in the {cuisine} cuisine.", llm_evaluator='palm')

Here is an invocation:

print(func3(dish='salad', cuisine='Russian', max_tokens=300))

**Ingredients:**

* 1 head of cabbage, shredded
* 1 carrot, grated
* 1/2 cup of peas, cooked
* 1/2 cup of chopped walnuts
* 1/2 cup of mayonnaise
* 1/4 cup of sour cream
* Salt and pepper to taste

**Instructions:**

1. In a large bowl, combine the cabbage, carrots, and peas.
2. In a small bowl, whisk together the mayonnaise, sour cream, salt, and pepper.
3. Pour the dressing over the salad and toss to coat.
4. Serve immediately or chill for later.

**Tips:**

* For a more flavorful salad, add some chopped fresh herbs, such as dill or parsley.
* You can also add some chopped red onion or celery to the salad.
* If you don't have any peas on hand, you can use green beans or corn instead.
* The dressing can be made ahead of time and stored in the refrigerator. Just be sure to bring it to room temperature before using it to dress the salad.

LLM example functions

The function llm_example_function can be given a training set of examples in order to generating results according to the “laws” implied by that training set.

Here a LLM is asked to produce a generalization:

llm_example_function({'finger': 'hand', 'hand': 'arm'})('foot')

' leg'

Here is an array of training pairs is used:

llm_example_function({"Einstein": "14 March 1879", "Pauli": "April 25, 1900"})('Oppenheimer')

' April 22, 1904'

Here is defined a LLM function for translating WL associations into Python dictionaries:

fea = llm_example_function(('<| A->3, 4->K1 |>', '{ A:3, 4:K1 }')) print(fea('<| 23->3, G->33, T -> R5|>'))

 { 23:3, G:33, T:R5 }

The function llm_example_function takes as a first argument:

Single tuple object of two scalars
A dict
A list object of pairs (tuple objects)

Remark: The function llm_example_function is implemented with llm_function and suitable prompt.

Here is an example of using hints:

fec = llm_example_function( {"crocodile" : "grasshopper", "fox" : "cardinal"}, hint = 'animal colors') print(fec('raccoon'))

 cardinal

Synthesizing responses

Here is an example of prompt synthesis with the function llm_synthesize using prompts from the package “LLMPrompts”, [AAp8]:

from LLMPrompts import * print( llm_synthesize([ llm_prompt("Yoda"), "Hi! How old are you?", llm_prompt("HaikuStyled") ]))

Young or old, matters not
Age is just a number, hmm
The Force is with me.

Using chat-global prompts

The configuration objects can be given prompts that influence the LLM responses “globally” throughout the whole chat. (See the second sequence diagram above.)

Chat objects

Here we create chat object that uses OpenAI’s ChatGPT:

prompt = "You are a gem expert and you give concise answers." chat = llm_chat(prompt = prompt, chat_id = 'gem-expert-talk', conf = 'ChatGPT')

chat.eval('What is the most transparent gem?')

'The most transparent gem is diamond.'

chat.eval('Ok. What are the second and third most transparent gems?')

'The second most transparent gem is sapphire, and the third most transparent gem is emerald.'

Here are the prompt(s) and all messages of the chat object:

chat.print()

Chat ID: gem-expert-talk
------------------------------------------------------------
Prompt:
You are a gem expert and you give concise answers.
------------------------------------------------------------
{'role': 'user', 'content': 'What is the most transparent gem?', 'timestamp': 1695699574.024279}
------------------------------------------------------------
{'role': 'assistant', 'content': 'The most transparent gem is diamond.', 'timestamp': 1695699575.158463}
------------------------------------------------------------
{'role': 'user', 'content': 'Ok. What are the second and third most transparent gems?', 'timestamp': 1695699588.455979}
------------------------------------------------------------
{'role': 'assistant', 'content': 'The second most transparent gem is sapphire, and the third most transparent gem is emerald.', 'timestamp': 1695699589.6835861}

References

Articles

[AA1] Anton Antonov, “Generating documents via templates and LLMs”, (2023), RakuForPrediction at WordPress.

[ZG1] Zoubin Ghahramani, “Introducing PaLM 2”, (2023), Google Official Blog on AI.

Repositories, sites

[OAI1] OpenAI Platform, OpenAI platform.

[WRIr1] Wolfram Research, Inc. Wolfram Prompt Repository.

Packages, paclets

[AAp1] Anton Antonov, LLM::Functions Raku package, (2023), GitHub/antononcube.

[AAp2] Anton Antonov, WWW::OpenAI Raku package, (2023), GitHub/antononcube.

[AAp3] Anton Antonov, WWW::PaLM Raku package, (2023), GitHub/antononcube.

[AAp4] Anton Antonov, Text::SubParsers Raku package, (2023), GitHub/antononcube.

[AAp5] Anton Antonov, Text::CodeProcessing Raku package, (2021), GitHub/antononcube.

[AAp6] Anton Antonov, ML::FindTextualAnswer Raku package, (2023), GitHub/antononcube.

[AAp7] Anton Antonov, ML::NLPTemplateEngine Raku package, (2023), GitHub/antononcube.

[AAp8] Anton Antonov, LLMPrompts Python package, (2023), PyPI.org/antononcube.

[GAIp1] Google AI, google-generativeai (Google Generative AI Python Client), (2023), PyPI.org/google-ai.

[OAIp1] OpenAI, openai (OpenAI Python Library), (2020-2023), PyPI.org.

[WRIp1] Wolfram Research, Inc. LLMFunctions paclet, (2023), Wolfram Language Paclet Repository.

Menu

Problem formulation

Reliability of results

Installation

Setup

Usage examples

Quantile Regression (WL)

Latent Semantic Analysis (R)

Random tabular data generation (Raku)

Recommender workflow (Python)

How it works?

Bring your own templates

References

Articles, blog posts

Functions, packages, repositories

Videos

Introduction

Setup

Retrieval

Tabulate Languages and Workflows

Python LSA Examples

LangChain few-shot prompt

Translation With Ollama Model

Simulated Translation With a Fake LLM

References

Введение

Структура

Наблюдения

Получение текста интервью

Предварительные запросы по программе LLM

Вопросы

Важные части

Самые провокационные вопросы

Самые важные высказывания

Часть 1: разделение и резюме

Краткое содержание первой части

Часть 2: тематические части

Разговорные части интервью

Поисковая система

Стилизованные вариации

Карлсон -> Клинтон

Путин -> Трамп

Ссылки

Статьи / Articles

Пакеты / Packages

Видео / Videos

Installation

Install from GitHub

From PyPi

Basic usage examples

Prompt data retrieval

Code generating function

Fixing function

Chat object creation with a prompt

References

Articles

Packages, paclets, repositories

Installation

Install from GitHub

From PyPi

Design

Configurations

OpenAI-based

PaLM-based

Basic usage of LLM functions

Textual prompts

Positional arguments

Named arguments

LLM example functions

Synthesizing responses

Using chat-global prompts

Chat objects

References

Articles

Repositories, sites

Packages, paclets