发布时间:2024-07-31作者:彭晟旭点击:
使用 SQL 语句排序
sql
SELECT FROM table_name ORDER BY column_name ASC/DESC, another_column_name ASC/DESC, word ASC/DESC;
例如:
```sql
SELECT FROM articles ORDER BY title ASC, author ASC, word ASC;
```
使用 Python 编程
```python
import sqlalchemy
engine = sqlalchemy.create_engine("connection_string")
connection = engine.connect()
query = sqlalchemy.orm.query.Query(Article).order_by(
Article.title.asc(),
Article.author.asc(),
Article.word.asc()
```
使用 ORM
```python
from sqlalchemy import Column, Integer, String
from sqlalchemy.orm import sessionmaker
class Article(Base):
__tablename__ = "articles"
id = Column(Integer, primary_key=True)
title = Column(String)
author = Column(String)
word = Column(String)
初始化数据库并创建会话
Base.metadata.create_all(engine)
Session = sessionmaker(bind=engine)
session = Session()
查询文章并按标题、作者和单词排序
articles = session.query(Article).order_by(Article.title, Article.author, Article.word).all()
```
注意:
`ASC` 表示升序,`DESC` 表示降序。
关键字 `word` 应该是表中存在的列名。
只有在表中明确定义了 `word` 列的情况下,此排序才有效。
在 Excel 中设置第三排序关键字为文本格式:
1. 选择要排序的数据范围。
2. 单击“数据”选项卡。
3. 在“排序”组中,单击“自定义排序”。
4. 在“自定义排序”对话框中,单击“添加级别”。
5. 在“列”下拉列表中,选择包含第三排序关键字的列。
6. 在“排序”下拉列表中,选择“文本”。
7. 单击“确定”关闭对话框。
8. 现在,第三排序关键字将按文本格式进行排序。
示例:
假设您有一个数据集如下图所示:
| 名称 | 部门 | 职务 |
|---|---|---|
| 张三 | 销售 | 经理 |
| 李四 | 市场 | 主管 |
| 王五 | 研发 | 工程师 |
| 赵六 | 销售 | 主管 |
| 钱七 | 市场 | 经理 |
如果要按部门、职务、名称的顺序对数据进行排序,则可以将第三排序关键字(名称)设置为文本格式:
1. 选择 A1:D5 数据范围。
2. 执行步骤 2-7。
3. 在“自定义排序”对话框中,第三排序关键字设置为以下内容:
列: 名称
排序: 文本
排序后的结果如下:
| 名称 | 部门 | 职务 |
|---|---|---|
| 赵六 | 销售 | 主管 |
| 张三 | 销售 | 经理 |
| 李四 | 市场 | 主管 |
| 钱七 | 市场 | 经理 |
| 王五 | 研发 | 工程师 |
关键字:
关键词提取
文本分类
主题建模
词频–逆向文件频率 (TF-IDF)
停用词去除
类型:
无监督方法:
主题建模:确定文本集合中的潜在主题或模式。(例如,潜在狄利克雷分配、概率潜在语义索引)
词群分析:识别单词或短语组成的词群或共现模式。(例如,词群共现分析、预训练语言模型)
监督方法:
关键词提取:识别与指定标签或类别最相关的单词或短语。(例如,决策树、支持向量机)
文本分类:将文本分配到预定义的类别中。(例如,朴素贝叶斯、逻辑回归)
半监督方法:
引导自我训练:使用已标记的数据来初始化模型,并使用它来标记更多的数据,进而改进模型。(例如,基于主题建模的引导自我训练)
其他方法:
词频–逆向文件频率 (TF-IDF):一种加权方案,考虑单词在文档和文档集合中的频率。(例如,Term Frequency–Inverse Document Frequency)
停用词去除:删除在文本中常见的、无意义的单词。(例如,“the”、“of”、“and”)
词形还原:将单词还原为它们的根/基准形式。(例如,“running” -> “run”)
情感分析:识别文本中的情感极性。(例如,积极、消极、中立)
当使用 Microsoft Word 中的“排序”功能时,最多可以设置两个关键字。第三个关键字的设置不受支持。
2023-08-31
2023-10-14
2023-08-05
2023-08-29
2023-09-25
2023-09-23
2023-09-23
2023-09-11
2023-09-23
2023-09-06